全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月3日

07:45

07:45

Jerry Liu@jerryjliu0

LlamaIndex 创始人 Jerry Liu 指出，初创公司相比前沿实验室的一个核心优势在于模型路由（model routing）能力。随着开源和闭源模型在成本-性能曲线上形成健康分布，初创公司可以通过为每个任务精准选择最合适的模型，在保持前沿性能的同时将成本和延迟降低 2-10 倍。Factory 推出的模型路由功能正是这一理念的实践，能自动为每个任务选择最佳模型，削减 25% 成本。这一策略让初创公司能够优化模型组合，实现更高的效率。

AI产品模型路由成本优化初创公司 Agent/智能体 Factory

推荐理由：模型路由是 AI 应用落地的关键杠杆，做 AI 产品/Agent 的团队可以直接借鉴——用更少的钱跑出更好的效果，建议点开看看具体怎么实现。

5月29日

09:18

09:18

shao__meng@shao__meng

83°

Anthropic 在宣布 H 轮 650 亿美金融资当天，发布了 Claude Opus 4.8。该模型在编码、Agent 任务和知识工作方面显著提升，SWE-Bench Pro 达到 69.2%，Terminal-Bench 2.1 为 74.6%。关键改进包括更诚实的自我监控（误判减少 4 倍）、更稳定的 Agent 协作质量，以及计算机/浏览器 Agent 能力提升（OSWorld-Verified 83.4%）。同时引入 Claude Code Dynamic Workflows，支持从单 Agent 到规划、并行、验证的协作模式。定价不变，即日可用。

AI模型 Claude Opus 4.8 推理模型 Agent/智能体编程助手浏览器自动化

推荐理由：做复杂编码、Agent 和浏览器自动化的团队可以直接升级——Opus 4.8 在诚实度和任务完成率上都有实质提升，且价格不变，值得立即试用。