全部 AI 动态 · AI 热点

6月29日

13:49

13:49

Ethan Mollick@emollick

AA-Briefcase评分由@ArtificialAnlys发布，用于衡量AI完成多周复杂咨询任务的能力。最新得分曲线显示，AI模型在短期内取得了快速进步。开放权重模型与封闭模型之间存在明显的差距，封闭模型整体表现更优。该评测揭示了当前AI在多步骤复杂任务中的能力差异。

AI模型 AA-Briefcase 开放模型封闭模型 AI基准

推荐理由：新评测让AI做多周复杂咨询，结果看到开放模型和封闭模型差距挺大，进步也很快。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月10日

06:02

06:02

rohanpaul_ai@rohanpaul_ai

本期新闻通讯涵盖多个AI领域重要动态：Claude此前被认为“过于危险”的模型终于公开，但存在使用限制；Cognition推出FrontierCode基准测试，评估AI代码是否达到人类维护者可合并的质量；Claude Fable 5在高级AI研究方面存在隐性限制；Anthropic研究显示AI智能体在编程中表现优异，但在生物学任务中可能从起点就失败；Claude Code团队分享实用技巧以充分发挥其潜力。

行业 Claude FrontierCode AI基准编程助手 AI安全

推荐理由：开发者可关注FrontierCode基准，评估AI代码的真实可维护性；Claude Code用户可借鉴团队技巧提升效率；AI研究者需了解Claude Fable 5的隐性限制。