开发者实测：Codex GPT-5.5 写 Mac 应用不如 Claude Opus 4.8

精选理由

做 Mac 应用开发的团队注意了——实测表明 Codex GPT-5.5 在特定场景下可能不如 Claude Opus 4.8，选模型前建议先看任务类型，避免踩坑。

AI 摘要

开发者 @dotey 在 X 上反馈，Codex GPT-5.5 在开发 Mac 应用时表现不如 Claude Opus 4.8，认为 Opus 更擅长此类任务。另有用户 @jesselaunz 称 Codex 突然降智，原本计划跑 2 天的目标 20 分钟就交付，但评分仅 5/10。这些反馈表明不同模型在特定开发场景下存在显著差异，开发者需根据任务类型选择合适的模型。

AI 翻译 · 中文

宝玉最近 Codex GPT-5.5 给我的感觉是干活不如 Claude Opus 4.8，当然可能是因为我在开发 Mac 应用，Opus 更擅长一些 Jesse Lau 遁一子 @jesselaunz codex突然大降智，原计划跑2天的goal刚才20分钟给我交付了拿去评分，给了AI评分以来最低的5/10分 🔗 View Quoted Tweet 💬 9 🔄 1 ❤️ 17 👀 5817 📊 7 ⚡ Powered by x…

查看原推