OpenSquilla 开源项目：用 Python 重写“小龙虾”，省 90% Token

精选理由

AI 调用成本高、Token 浪费严重的团队终于有了实用解法——OpenSquilla 智能路由能省 90% 费用，做多模型编排或 Skill 密集型应用的开发者值得立刻试试。

AI 摘要

国内团队开源了 OpenSquilla，用 Python 重写了“小龙虾”项目，解决了其 Token 消耗高、不按规则执行和安全问题。它集成本地小模型，对请求进行智能路由：简单任务派给便宜模型，复杂任务才用顶级模型，类似医院分诊。官方测试显示，25 个任务混合使用 Opus 4.7、GLM 5.1 和 DS4 Flash，成本从 6.2 美元降至 0.68 美元，效果几乎一致。此外，它还能根据对话语义只注入匹配度最高的 Skill，避免将所有 Skill 描述塞入上下文，100 次对话可省 100 万 Token。

AI 翻译 · 中文

小互被 AI 不听话折磨了大半年，终于找到解法了发现一个开源项目 OpenSquilla，国内团队做的他们用 Python 把"小龙虾"重写了一遍解决了它太费token、不按照规则执行以及安全的问题 100 次对话就能省下 100万 Token 先说省钱：它集成了一个本地的小模型，你发的每一个请求，在真正发给大模型之前，会被这个小模型极速向量化，分析这个请求到底是简单任务还是复杂任务。简单的发给便宜模型，复杂的才…

查看原推