从数草莓到IMO金牌：LLM两年进化惊人

精选理由

数学推理是AI能力的硬指标，从数不清草莓到IMO金牌再到解决几何难题，这个时间线让所有关注AI能力边界的开发者震撼——建议点开看看，你会对模型进化速度有全新认知。

AI 摘要

2024年6月，通用大模型连草莓里有多少个r都数不清；2025年7月，最新模型已在国际数学奥林匹克竞赛中获得金牌；到2026年5月，模型甚至解决了组合几何中一个著名难题。这一系列对比展示了LLM在数学推理能力上的飞速进步，从基础计数到顶尖竞赛再到前沿研究，仅用两年时间。

AI 翻译 · 中文

Ethan MollickJune 2024: The latest general-purpose LLMs could not count the r's in strawberry. July 2025: The latest general-purpose LLMs get gold in the International Math Olympiad. May 2026: The latest general-purpose LLM solve one…

查看原推