AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
精选
过去 24 小时,从 847 条中筛出 48 条
全部模型产品行业论文技巧
标签:有效反馈计算×
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月1日
22:42
22:42rohanpaul_ai@rohanpaul_ai
精选72°
一篇新论文指出,AI Agent 系统的扩展不应仅依赖增加计算量,而应关注有效反馈的利用。作者提出“有效反馈计算”(EFC)指标,只计算那些能教会智能体有用信息并改变后续决策的反馈。实验表明,任务归一化的 EFC 比原始计算量更能预测任务失败,在预算相同的情况下,更好的反馈将成功率从 0.27 提升至 0.90。该研究强调 Agent 系统本质上是“反馈机器”,而非简单的模型封装。
论文Agent 系统有效反馈计算扩展定律智能体评估反馈机制

推荐理由:做 Agent 系统或智能体框架的开发者,别再只盯着 token 和调用次数了——这篇论文给出了一个更聪明的衡量标准,直接帮你判断系统是否真的在“学习”。建议点开看看 EFC 怎么算,能省不少试错成本。
原文
00:09
AITOP6月1日 00:09
OpenAI 发起“Codex for Open Source”:免费赠送 6 个月 Pro 订阅,开源维护者能否迎来 AI 变革?
5月30日
11:34
11:34elvis@omarsar0
精选72°
一项新研究提出了有效反馈计算(EFC)指标,用于衡量智能体实际可用的反馈量,替代传统的原始token和工具调用计数。实验表明,原始计数只能解释33%-42%的智能体失败原因,而EFC的解释力达到99%。在相同计算预算下,仅通过按有效反馈重新分配资源,就能将智能体成功率从0.27提升至0.90。该研究将智能体框架设计从猜测转变为可预测的科学。
论文智能体有效反馈计算Scaling LawsAgent Harness性能优化

推荐理由:做智能体框架或Agent Harness的开发者,终于有了一个可量化的优化指标——EFC能让你用相同算力把成功率翻三倍,值得点开论文细读。
原文
5月29日
08:02
AITOP5月29日 08:02
Opus 4.8发布:编程助手的“静默时刻”,是解放开发者,还是新门槛?🔥Anthropic 把 AI 编程的“确认键”彻底删掉了!Claude Code 搭载全新 Opus 4.8 模型,长时间任务不跑偏、不废话、不中断,像一个资深工程师一样默默干活,从功能开发到漏洞清扫全包圆,你在旁边喝茶等结果就行。过去 AI 写代码三步一问“这样可以吗”,现在它直接交完整交付物……自主编程的最后一层窗户纸,被捅破了。做自动化开发和代码审查的团队,这个模型建议直接上手,效率差距肉眼可见……Opus 4.8发布:编程助手的“静默时刻”,是解放开发者,还是新门槛?
精选全部日报登录