全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

09:00

09:00

lmarena.ai@lmarena_ai

Anthropic 的 Claude Fable 5 模型在 Vision Arena 排行榜中综合排名第二，并在多个子类别中表现突出。其中，OCR（光学字符识别）单项排名第一，作业和图表理解分别排名第二。Vision Arena 是一个专注于视觉理解能力的评测平台，该成绩表明 Claude Fable 5 在视觉任务上具有较强竞争力。

AI模型 Claude Fable 5 Vision Arena OCR 视觉理解模型评测

推荐理由：Claude Fable 5 在视觉评测中拿下 OCR 第一，做文档处理、教育或图表分析的团队可以重点关注这个模型的实际表现。

5月31日

00:34

00:34

berryxia@berryxia

精选

开发者 Ivan Fioravanti 在 mlx-vlm 项目中新增了对 Step 3.7 Flash 模型的支持，将其转换为 MLX 格式后，视觉理解和文本生成功能均可在本地运行。该模型在 128GB Apple Silicon 机器上，4bit 量化版本支持 32K 上下文，生成速度超过 53 tokens/s。实测中，模型能快速准确地从截图中提取结构信息和关键元素。这一更新将高质量视觉语言任务从云端迁移到个人 Mac，兼顾隐私、速度和零额外费用，推动本地多模态 AI 进入实用阶段。

AI产品 mlx-vlm Step 3.7 Flash 本地多模态 Apple Silicon 视觉理解

推荐理由：本地跑通高质量视觉语言模型，做多模态应用或隐私敏感项目的开发者可以直接在 Mac 上体验，无需依赖云端，值得一试。

5月23日

02:16

02:16

Logan Kilpatrick@OfficialLoganK

精选

Gemini 3.5 Flash 在 Roboflow 视觉评估中多项指标超越 3.1 Pro。其平均推理速度快约6倍，大幅降低延迟。该模型在多模态理解上展示出更强能力，尤其适合视觉密集型任务。

AI模型 Gemini 3.5 Flash Gemini 3.1 Pro Google 多模态视觉理解

推荐理由：谷歌新 Flash 视觉又快又准