11:43arXiv cs.AI@Shangding Gu76°本文提出 Agentic AI 的下一个瓶颈是系统缩放(system scaling),而非仅模型缩放。作者主张将基础模型周围的结构化执行层(即 harness)作为一等设计对象,包括记忆、检索、工具使用、编排、验证和治理等组件。研究识别出三大核心瓶颈:上下文治理、可信记忆和动态技能路由,并提出了超越单次任务成功率的基准测试框架。为验证观点,团队开发了 Python 原生参考实现 CheetahClaws,并与 Claude Code 和 OpenClaw 进行了对比。核心结论是:未来 Agentic AI 的进步将同样依赖于系统设计,而不仅仅是更强的模型。论文智能体系统缩放Harness设计上下文治理可信记忆4 个信源在谈推荐理由:做 Agent 系统架构的开发者会看到,当前只关注模型能力而忽视执行层设计的做法正在成为瓶颈——CheetahClaws 提供了一个可参考的系统级设计思路,值得研究。原文