Claude Fable 5 在 FrontierMath 最难题目上领先 GPT-5.5 13 个百分点

Claude Fable 5 outpaces GPT-5.5 by 13 points on FrontierMath's toughest problems

精选理由

Anthropic 新模型数学碾压 GPT-5.5

AI 摘要

Anthropic 的 Claude Fable 5 在 FrontierMath 最难层级上达到 88% 准确率,较 Opus 4.5 在 2026 年初低于 10% 的成绩大幅提升。OpenAI 的 GPT-5.5 在同一层级上达到约 75%。两者差距为 13 个百分点,显示 AI 数学能力加速提升。

AI 翻译 · 中文

Anthropic 的 Claude Fable 5 在 FrontierMath 最难层级上达到 88% 准确率,较 Opus 4.5 在 2026 年初低于 10% 的成绩大幅提升。OpenAI 的 GPT-5.5 在同一层级上达到约 75%。两者差距为 13 个百分点,显示 AI 数学能力加速提升。

DecoderAnthropic's Claude Fable 5 hits 88 percent accuracy on the hardest FrontierMath tier, a massive jump from Opus 4.5, which sat below 10 percent in early 2026. OpenAI's GPT-5.5 reaches about 75 percent on the same tier. Th