论文76°

从模型缩放转向系统缩放:Agentic AI 的 Harness 设计

From Model Scaling to System Scaling: Scaling the Harness in Agentic AI

精选理由

做 Agent 系统架构的开发者会看到,当前只关注模型能力而忽视执行层设计的做法正在成为瓶颈——CheetahClaws 提供了一个可参考的系统级设计思路,值得研究。

AI 摘要

本文提出 Agentic AI 的下一个瓶颈是系统缩放(system scaling),而非仅模型缩放。作者主张将基础模型周围的结构化执行层(即 harness)作为一等设计对象,包括记忆、检索、工具使用、编排、验证和治理等组件。研究识别出三大核心瓶颈:上下文治理、可信记忆和动态技能路由,并提出了超越单次任务成功率的基准测试框架。为验证观点,团队开发了 Python 原生参考实现 CheetahClaws,并与 Claude Code 和 OpenClaw 进行了对比。核心结论是:未来 Agentic AI 的进步将同样依赖于系统设计,而不仅仅是更强的模型。

AI 翻译 · 中文

本文提出 Agentic AI 的下一个瓶颈是系统缩放(system scaling),而非仅模型缩放。作者主张将基础模型周围的结构化执行层(即 harness)作为一等设计对象,包括记忆、检索、工具使用、编排、验证和治理等组件。研究识别出三大核心瓶颈:上下文治理、可信记忆和动态技能路由,并提出了超越单次任务成功率的基准测试框架。为验证观点,团队开发了 Python 原生参考实现 CheetahClaws,并与 Claude Code 和 OpenClaw 进行了对比。核心结论是:未来 Agentic AI 的进步将同样依赖于系统设计,而不仅仅是更强的模型。

arXiv cs.AIThis paper studies the next major bottleneck in agentic AI as system scaling, not only model scaling: the design of auditable, persistent, modular, and verifiable architectures around foundation models. We refer to this