Gary Marcus 承认误判：GPT-5.5 可复现 Erdos 类似效果

精选理由

Gary Marcus 公开认错，说明 AI 模型评估比想象中复杂——做模型对比的团队值得关注这个反转，避免自己踩坑。

AI 摘要

AI 研究者 Gary Marcus 在 X 上公开承认此前对 OpenAI 新模型 Erdos 的批评有误。他根据新信息表示，即使 OpenAI 在 Erdos 上使用了新模型，但 GPT-5.5 也能实现类似效果，Ethan Mollick 的估算基本适用。这一反转表明，当前 GPT 系列的能力可能被低估，且新模型与现有模型的差距可能没有想象中大。对于关注 AI 模型进展和评估的研究者与开发者，这是一个值得注意的修正。

AI 翻译 · 中文

Gary Marcusoops! wild update, strongly supports @emollick ’s overall take: Gary Marcus @GaryMarcus I have to eat crow on this, in light of further information. whatever OpenAI spent on Erdos using a new model, apparently you can ge…

Ethan Mollick05-20 23:59原文
Greg Brockman05-23 04:51原文
OpenAI05-20 19:06原文
Sam Altman05-20 20:53原文
AI Will05-21 06:09原文
IT之家05-21 06:51原文
rohanpaul_ai05-21 06:57原文
orange.ai05-21 08:37原文
阿里通义 Qwen05-21 13:20原文
arXiv: OpenAI05-21 16:55原文

查看原推