精选理由
Kimi 发了新编程模型 K2.7 Code,推理更省 token,基准提升明显,而且在 Agent Arena 上开源模型里排第6,值得一试。
Kimi K2.7 Code 在 Agent Arena 排行榜上总体排名第19,在开源模型中排第6。该模型在 Kimi Code Bench v2 上比 K2.6 提升21.8%,在 Program Bench 上提升11.0%,在 MLS Bench Lite 上提升31.5%。推理 token 使用量降低30%,减少了过度思考。长程编码任务指令遵循和完成率均有提升。目前通过 Kimi API 和 Kimi Code 可用。
AI 翻译 · 中文
Kimi K2.7 Code 在 Agent Arena 排行榜上总体排名第19,在开源模型中排第6。该模型在 Kimi Code Bench v2 上比 K2.6 提升21.8%,在 Program Bench 上提升11.0%,在 MLS Bench Lite 上提升31.5%。推理 token 使用量降低30%,减少了过度思考。长程编码任务指令遵循和完成率均有提升。目前通过 Kimi API 和 Kimi Code 可用。
Kimi K2.7 Code by @Kimi_Moonshot ranks #19 overall on the new Agent Arena leaderboard, and #6 among open models. In Agent Arena, we measure models on millions of real-world, long-horizon agentic tasks from a global commu…