从模型缩放转向系统缩放：Agentic AI 的 Harness 设计

精选理由

做 Agent 系统架构的开发者会看到，当前只关注模型能力而忽视执行层设计的做法正在成为瓶颈——CheetahClaws 提供了一个可参考的系统级设计思路，值得研究。

AI 摘要

本文提出 Agentic AI 的下一个瓶颈是系统缩放（system scaling），而非仅模型缩放。作者主张将基础模型周围的结构化执行层（即 harness）作为一等设计对象，包括记忆、检索、工具使用、编排、验证和治理等组件。研究识别出三大核心瓶颈：上下文治理、可信记忆和动态技能路由，并提出了超越单次任务成功率的基准测试框架。为验证观点，团队开发了 Python 原生参考实现 CheetahClaws，并与 Claude Code 和 OpenClaw 进行了对比。核心结论是：未来 Agentic AI 的进步将同样依赖于系统设计，而不仅仅是更强的模型。

AI 翻译 · 中文

arXiv cs.AIThis paper studies the next major bottleneck in agentic AI as system scaling, not only model scaling: the design of auditable, persistent, modular, and verifiable architectures around foundation models. We refer to this …

IT之家05-24 08:40原文
AI Will05-24 13:07原文
Viking05-27 11:55原文
marktechpost05-23 19:31原文

阅读原文