Codex 降智测试：用糖果数学题对比不同模型推理效果

精选理由

想测不同模型对同一道题的推理差别？用这个脚本跑糖果题，还能调reasoning effort，很直观。

AI 摘要

一个轻量Python脚本让Codex CLI反复回答同一道糖果数学题，用于对比不同模型的表现。脚本可调整reasoning effort参数并观察效果。代码开源于GitHub，便于复现和扩展。

AI 翻译 · 中文

GeekCodex 降智测试一个很轻的 Python 脚本，让 Codex CLI 反复回答同一道糖果数学题，对比不同模型和 reasoning effort 的效果。 github.com/haowang02/code… 💬 4 🔄 2 ❤️ 5 👀 1675 📊 6 ⚡ Powered by xgo.ing

查看原推