13:05Aran Komatsuzaki (论文推介)@arankomatsuzaki精选Aran Komatsuzaki 使用 Codex 的 /goal 命令,自动探索一些 20-50 年历史的未解猜想,运行 8 小时后已看到可发表的进展。他认为人们高估了“开放数十年”作为重要性的指标,很多旧问题只是无聊但难,而非真正重要。他主张加速近期研究方向,因为社区有共识和品味,而旧问题参与者少、门槛高。他的更强观点是:当前模型已能 95% 自动化地推动前沿,但领域人士保守、AI 人士不了解深层问题,导致这一能力被低估。AI产品Codex自动推理数学猜想AI 研究未解问题推荐理由:Aran 用 Codex 自动探索未解猜想 8 小时就看到了可发表进展,做自动推理或数学研究的开发者值得关注——这暗示了 AI 在数学前沿的潜力被严重低估,建议试试 Codex /goal 在自己的领域跑一跑。原文
AITOP5月29日 08:02Opus 4.8发布:编程助手的“静默时刻”,是解放开发者,还是新门槛?🔥Anthropic 把 AI 编程的“确认键”彻底删掉了!Claude Code 搭载全新 Opus 4.8 模型,长时间任务不跑偏、不废话、不中断,像一个资深工程师一样默默干活,从功能开发到漏洞清扫全包圆,你在旁边喝茶等结果就行。过去 AI 写代码三步一问“这样可以吗”,现在它直接交完整交付物……自主编程的最后一层窗户纸,被捅破了。做自动化开发和代码审查的团队,这个模型建议直接上手,效率差距肉眼可见……