GPT-5.5 在评测中登顶，效率也最优

精选理由

GPT-5.5 在评测中不仅性能第一，还兼顾了 token 和成本效率，做模型选型的团队可以直接参考这个结果来优化预算。

AI 摘要

OpenAI 的 GPT-5.5 模型在一项公开评测中取得了最高分。更令人关注的是，它在考虑 token 消耗、成本和实际运行时间后，依然保持最佳表现。这表明 GPT-5.5 不仅在能力上领先，在效率方面也具备显著优势。对于追求高性能与低成本平衡的开发者来说，这是一个重要信号。

AI 翻译 · 中文

Noam Brown (OpenAI 推理)I'm happy GPT-5.5 tops this eval I'm even happier it's still doing the best when measured vs tokens, cost, or wall-clock time! https://t.co/5UD5IyqtAm

Artificial Analysis06-12 04:48原文
John Schulman06-12 04:49原文
lmarena.ai06-11 19:35原文
Mira Murati (TML)06-12 04:30原文
Mark Chen (OpenAI 研究)06-12 04:35原文
Decoder06-13 10:16原文
marktechpost06-10 22:07原文
PolymarketMoney06-11 02:17原文
IT之家06-11 02:38原文
arXiv cs.AI06-11 17:20原文

查看原推