全部 AI 动态 · AI 热点

6月19日

22:18

22:18

Decoder@Maximilian Schreiner

一项新基准测试评估了AI处理真实知识工作的能力。即使是最先进的AI模型，也仅能完全解决3%的任务。这一结果凸显了当前AI在处理复杂、多步骤的知识工作方面仍存在巨大短板。

AI模型基准测试知识工作 AI性能

推荐理由：这个新基准狠狠打了AI的脸——最强模型也只完成3%的真实知识工作，别看平时吹得厉害。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月2日

17:15

17:15OpenAI Blog（博客/媒体）

OpenAI 发布《知识工作的下一时代》报告，详细介绍了 Codex 如何通过 AI 驱动的研究、数据分析、工作流自动化和内容创作来提升生产力。Codex 能够自动执行重复性任务、生成报告、分析数据集，并整合多种工具，帮助知识工作者节省时间、提高效率。该报告强调了 Codex 在金融、法律、医疗等领域的实际应用案例，展示了其作为通用生产力工具的潜力。

AI产品 Codex 知识工作生产力工具 AI自动化数据分析

推荐理由：知识工作者终于有了一个能真正自动化繁琐任务的 AI 工具——Codex 帮你做研究、分析数据、写报告，省下时间做更有价值的事。做咨询、金融、法律、内容创作的团队，值得看看实际案例。