AI模型精选

Kimi K2.7 Code 开源,Agent Arena 排名第19,开源模型中第6

Kimi K2.7 Code by @Kimi_Moonshot ranks #19 overall on the new Agent Arena leaderboard, and #6 among ...

精选理由

Kimi 发了新编程模型 K2.7 Code,推理更省 token,基准提升明显,而且在 Agent Arena 上开源模型里排第6,值得一试。

AI 摘要

Kimi K2.7 Code 在 Agent Arena 排行榜上总体排名第19,在开源模型中排第6。该模型在 Kimi Code Bench v2 上比 K2.6 提升21.8%,在 Program Bench 上提升11.0%,在 MLS Bench Lite 上提升31.5%。推理 token 使用量降低30%,减少了过度思考。长程编码任务指令遵循和完成率均有提升。目前通过 Kimi API 和 Kimi Code 可用。

AI 翻译 · 中文

Kimi K2.7 Code 在 Agent Arena 排行榜上总体排名第19,在开源模型中排第6。该模型在 Kimi Code Bench v2 上比 K2.6 提升21.8%,在 Program Bench 上提升11.0%,在 MLS Bench Lite 上提升31.5%。推理 token 使用量降低30%,减少了过度思考。长程编码任务指令遵循和完成率均有提升。目前通过 Kimi API 和 Kimi Code 可用。

lmarena.aiKimi K2.7 Code by @Kimi_Moonshot ranks #19 overall on the new Agent Arena leaderboard, and #6 among open models. In Agent Arena, we measure models on millions of real-world, long-horizon agentic tasks from a global commu