OpenSquilla 开源项目:用 Python 重写“小龙虾”,省 90% Token

被 AI 不听话折磨了大半年,终于找到解法了 发现一个开源项目 OpenSquilla,国内团队做的 他们用 Python 把"小龙虾"重写了一遍 解决了它太费token、不按照规则执行以及安全...

精选理由

AI 调用成本高、Token 浪费严重的团队终于有了实用解法——OpenSquilla 智能路由能省 90% 费用,做多模型编排或 Skill 密集型应用的开发者值得立刻试试。

AI 摘要

国内团队开源了 OpenSquilla,用 Python 重写了“小龙虾”项目,解决了其 Token 消耗高、不按规则执行和安全问题。它集成本地小模型,对请求进行智能路由:简单任务派给便宜模型,复杂任务才用顶级模型,类似医院分诊。官方测试显示,25 个任务混合使用 Opus 4.7、GLM 5.1 和 DS4 Flash,成本从 6.2 美元降至 0.68 美元,效果几乎一致。此外,它还能根据对话语义只注入匹配度最高的 Skill,避免将所有 Skill 描述塞入上下文,100 次对话可省 100 万 Token。

AI 翻译 · 中文

国内团队开源了 OpenSquilla,用 Python 重写了“小龙虾”项目,解决了其 Token 消耗高、不按规则执行和安全问题。它集成本地小模型,对请求进行智能路由:简单任务派给便宜模型,复杂任务才用顶级模型,类似医院分诊。官方测试显示,25 个任务混合使用 Opus 4.7、GLM 5.1 和 DS4 Flash,成本从 6.2 美元降至 0.68 美元,效果几乎一致。此外,它还能根据对话语义只注入匹配度最高的 Skill,避免将所有 Skill 描述塞入上下文,100 次对话可省 100 万 Token。

小互被 AI 不听话折磨了大半年,终于找到解法了 发现一个开源项目 OpenSquilla,国内团队做的 他们用 Python 把"小龙虾"重写了一遍 解决了它太费token、不按照规则执行以及安全的问题 100 次对话就能省下 100万 Token 先说省钱: 它集成了一个本地的小模型,你发的每一个请求,在真正发给大模型之前,会被这个小模型极速向量化,分析这个请求到底是简单任务还是复杂任务。简单的发给便宜模型,复杂的才