开发者实测:Codex GPT-5.5 写 Mac 应用不如 Claude Opus 4.8

最近 Codex GPT-5.5 给我的感觉是干活不如 Claude Opus 4.8,当然可能是因为我在开发 Mac 应用,Opus 更擅长一些

精选理由

做 Mac 应用开发的团队注意了——实测表明 Codex GPT-5.5 在特定场景下可能不如 Claude Opus 4.8,选模型前建议先看任务类型,避免踩坑。

AI 摘要

开发者 @dotey 在 X 上反馈,Codex GPT-5.5 在开发 Mac 应用时表现不如 Claude Opus 4.8,认为 Opus 更擅长此类任务。另有用户 @jesselaunz 称 Codex 突然降智,原本计划跑 2 天的目标 20 分钟就交付,但评分仅 5/10。这些反馈表明不同模型在特定开发场景下存在显著差异,开发者需根据任务类型选择合适的模型。

AI 翻译 · 中文

开发者 @dotey 在 X 上反馈,Codex GPT-5.5 在开发 Mac 应用时表现不如 Claude Opus 4.8,认为 Opus 更擅长此类任务。另有用户 @jesselaunz 称 Codex 突然降智,原本计划跑 2 天的目标 20 分钟就交付,但评分仅 5/10。这些反馈表明不同模型在特定开发场景下存在显著差异,开发者需根据任务类型选择合适的模型。

宝玉最近 Codex GPT-5.5 给我的感觉是干活不如 Claude Opus 4.8,当然可能是因为我在开发 Mac 应用,Opus 更擅长一些 Jesse Lau 遁一子 @jesselaunz codex突然大降智,原计划跑2天的goal刚才20分钟给我交付了 拿去评分,给了AI评分以来最低的5/10分 🔗 View Quoted Tweet 💬 9 🔄 1 ❤️ 17 👀 5817 📊 7 ⚡ Powered by x