全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月29日

16:56

16:56

rohanpaul_ai@rohanpaul_ai

76°

AI 智能体的能力不仅取决于模型本身，更依赖于其周围的系统（称为“harness”），包括记忆、工具、上下文、路由、检查和权限。当前许多智能体被误判为仅由模型驱动，而实际行为受这些系统组件影响更大。论文指出，进步应来自扩展 harness 的三个部分：更好的上下文控制、更可信的记忆、以及更优的工具或辅助智能体路由。长上下文不等于可用上下文，记忆多不等于可信，工具多不等于知道何时使用。两个智能体可能得出相同答案，但一个可能消耗更多 token、做出更冒险的工具调用或携带损坏的记忆。未来前沿不是单纯扩展模型，而是扩展系统纪律。

论文智能体系统扩展 harness 模型评测记忆管理

推荐理由：这篇论文点破了智能体评测的常见误区——只看模型不看系统，做智能体开发的团队值得读，能帮你重新思考系统架构的优先级。