全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月8日

10:54

10:54

宝玉@dotey

精选

Boris Cherny 分享了使用 Claude Opus 进行长时间自主运行的 5 条建议，强调 Agent 自行验证工作成果是避免浪费 Token 的关键。建议包括使用自动模式、动态工作流、/goal 或 /loop 指令、云端运行以及端到端自验证机制。这些技巧能帮助开发者让 AI Agent 持续工作数小时甚至数天，而无需人工干预。

AI产品 Claude Agent 长时间运行自验证 Token 优化

推荐理由：长时间运行 Agent 的开发者常被 Token 浪费困扰，Boris 的 5 条建议直击痛点，尤其是自验证机制能大幅提升效率，做自动化工作流的团队值得一试。

6月3日

19:13

19:13

小互@imxiaohu

国内团队开源了 OpenSquilla，用 Python 重写了“小龙虾”项目，解决了其 Token 消耗高、不按规则执行和安全问题。它集成本地小模型，对请求进行智能路由：简单任务派给便宜模型，复杂任务才用顶级模型，类似医院分诊。官方测试显示，25 个任务混合使用 Opus 4.7、GLM 5.1 和 DS4 Flash，成本从 6.2 美元降至 0.68 美元，效果几乎一致。此外，它还能根据对话语义只注入匹配度最高的 Skill，避免将所有 Skill 描述塞入上下文，100 次对话可省 100 万 Token。

AI产品开源/仓库 Token 优化模型路由成本控制 Python

推荐理由：AI 调用成本高、Token 浪费严重的团队终于有了实用解法——OpenSquilla 智能路由能省 90% 费用，做多模型编排或 Skill 密集型应用的开发者值得立刻试试。

5月25日

13:27

13:27

Varun Mohan@_mohansolo

精选

Antigravity 团队收到用户反馈，认为当前版本在简单任务上消耗过多 Token。为此，他们新增了 Gemini 3.5 Flash (Low) 模型选项，专门优化 Token 使用。内部测试显示，该模型比 Gemini 3.5 Flash (Medium) 减少约 45% 的 Token 生成量，且在 SWE 任务上整体优于 Gemini 3 Flash (High)。同时，所有付费计划的 Gemini 配额已被重置，确保用户在未来一周有足够 Token 进行开发。

AI产品 Antigravity Gemini 3.5 Flash Token 优化 SWE 任务开发者工具

推荐理由：Antigravity 用户终于可以省 Token 了——简单任务用低配模型能省近一半，做自动化开发的团队建议立刻切换试试。