10:54宝玉@dotey精选Boris Cherny 分享了使用 Claude Opus 进行长时间自主运行的 5 条建议,强调 Agent 自行验证工作成果是避免浪费 Token 的关键。建议包括使用自动模式、动态工作流、/goal 或 /loop 指令、云端运行以及端到端自验证机制。这些技巧能帮助开发者让 AI Agent 持续工作数小时甚至数天,而无需人工干预。AI产品ClaudeAgent长时间运行自验证Token 优化推荐理由:长时间运行 Agent 的开发者常被 Token 浪费困扰,Boris 的 5 条建议直击痛点,尤其是自验证机制能大幅提升效率,做自动化工作流的团队值得一试。原文
19:13小互@imxiaohu国内团队开源了 OpenSquilla,用 Python 重写了“小龙虾”项目,解决了其 Token 消耗高、不按规则执行和安全问题。它集成本地小模型,对请求进行智能路由:简单任务派给便宜模型,复杂任务才用顶级模型,类似医院分诊。官方测试显示,25 个任务混合使用 Opus 4.7、GLM 5.1 和 DS4 Flash,成本从 6.2 美元降至 0.68 美元,效果几乎一致。此外,它还能根据对话语义只注入匹配度最高的 Skill,避免将所有 Skill 描述塞入上下文,100 次对话可省 100 万 Token。AI产品开源/仓库Token 优化模型路由成本控制Python推荐理由:AI 调用成本高、Token 浪费严重的团队终于有了实用解法——OpenSquilla 智能路由能省 90% 费用,做多模型编排或 Skill 密集型应用的开发者值得立刻试试。原文
13:27Varun Mohan@_mohansolo精选Antigravity 团队收到用户反馈,认为当前版本在简单任务上消耗过多 Token。为此,他们新增了 Gemini 3.5 Flash (Low) 模型选项,专门优化 Token 使用。内部测试显示,该模型比 Gemini 3.5 Flash (Medium) 减少约 45% 的 Token 生成量,且在 SWE 任务上整体优于 Gemini 3 Flash (High)。同时,所有付费计划的 Gemini 配额已被重置,确保用户在未来一周有足够 Token 进行开发。AI产品AntigravityGemini 3.5 FlashToken 优化SWE 任务开发者工具推荐理由:Antigravity 用户终于可以省 Token 了——简单任务用低配模型能省近一半,做自动化开发的团队建议立刻切换试试。原文