GPT-5.5 在评测中登顶,效率也最优

I'm happy GPT-5.5 tops this eval I'm even happier…

精选理由

GPT-5.5 在评测中不仅性能第一,还兼顾了 token 和成本效率,做模型选型的团队可以直接参考这个结果来优化预算。

AI 摘要

OpenAI 的 GPT-5.5 模型在一项公开评测中取得了最高分。更令人关注的是,它在考虑 token 消耗、成本和实际运行时间后,依然保持最佳表现。这表明 GPT-5.5 不仅在能力上领先,在效率方面也具备显著优势。对于追求高性能与低成本平衡的开发者来说,这是一个重要信号。

AI 翻译 · 中文

OpenAI 的 GPT-5.5 模型在一项公开评测中取得了最高分。更令人关注的是,它在考虑 token 消耗、成本和实际运行时间后,依然保持最佳表现。这表明 GPT-5.5 不仅在能力上领先,在效率方面也具备显著优势。对于追求高性能与低成本平衡的开发者来说,这是一个重要信号。

Noam Brown (OpenAI 推理)I'm happy GPT-5.5 tops this eval I'm even happier it's still doing the best when measured vs tokens, cost, or wall-clock time! https://t.co/5UD5IyqtAm
  • Artificial Analysis06-12 04:48原文
  • John Schulman06-12 04:49原文
  • lmarena.ai06-11 19:35原文
  • Mira Murati (TML)06-12 04:30原文
  • Mark Chen (OpenAI 研究)06-12 04:35原文
  • Decoder06-13 10:16原文
  • marktechpost06-10 22:07原文
  • PolymarketMoney06-11 02:17原文
  • IT之家06-11 02:38原文
  • arXiv cs.AI06-11 17:20原文