AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:Agent/智能体×
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月3日
07:45
07:45Jerry Liu@jerryjliu0
LlamaIndex 创始人 Jerry Liu 指出,初创公司相比前沿实验室的一个核心优势在于模型路由(model routing)能力。随着开源和闭源模型在成本-性能曲线上形成健康分布,初创公司可以通过为每个任务精准选择最合适的模型,在保持前沿性能的同时将成本和延迟降低 2-10 倍。Factory 推出的模型路由功能正是这一理念的实践,能自动为每个任务选择最佳模型,削减 25% 成本。这一策略让初创公司能够优化模型组合,实现更高的效率。
AI产品模型路由成本优化初创公司Agent/智能体Factory

推荐理由:模型路由是 AI 应用落地的关键杠杆,做 AI 产品/Agent 的团队可以直接借鉴——用更少的钱跑出更好的效果,建议点开看看具体怎么实现。
原文
5月29日
09:18
09:18shao__meng@shao__meng
83°
Anthropic 在宣布 H 轮 650 亿美金融资当天,发布了 Claude Opus 4.8。该模型在编码、Agent 任务和知识工作方面显著提升,SWE-Bench Pro 达到 69.2%,Terminal-Bench 2.1 为 74.6%。关键改进包括更诚实的自我监控(误判减少 4 倍)、更稳定的 Agent 协作质量,以及计算机/浏览器 Agent 能力提升(OSWorld-Verified 83.4%)。同时引入 Claude Code Dynamic Workflows,支持从单 Agent 到规划、并行、验证的协作模式。定价不变,即日可用。
AI模型Claude Opus 4.8推理模型Agent/智能体编程助手浏览器自动化

推荐理由:做复杂编码、Agent 和浏览器自动化的团队可以直接升级——Opus 4.8 在诚实度和任务完成率上都有实质提升,且价格不变,值得立即试用。
原文
精选全部日报登录