13:05Aran Komatsuzaki (论文推介)@arankomatsuzaki精选Aran Komatsuzaki 使用 Codex 的 /goal 命令,自动探索一些 20-50 年历史的未解猜想,运行 8 小时后已看到可发表的进展。他认为人们高估了“开放数十年”作为重要性的指标,很多旧问题只是无聊但难,而非真正重要。他主张加速近期研究方向,因为社区有共识和品味,而旧问题参与者少、门槛高。他的更强观点是:当前模型已能 95% 自动化地推动前沿,但领域人士保守、AI 人士不了解深层问题,导致这一能力被低估。AI产品Codex自动推理数学猜想AI 研究未解问题推荐理由:Aran 用 Codex 自动探索未解猜想 8 小时就看到了可发表进展,做自动推理或数学研究的开发者值得关注——这暗示了 AI 在数学前沿的潜力被严重低估,建议试试 Codex /goal 在自己的领域跑一跑。原文
12:26Sakana AI@SakanaAILabs精选Sakana AI 在东京成立专门研究递归自我改进(RSI)的实验室「RSI Lab」,旨在让 AI 自动生成并改进 AI 模型。该实验室基于此前在 LLM-Squared、The AI Scientist 等项目上的积累,目标是在不依赖无限计算资源的前提下实现 RSI。2026 年以来,RSI 已成为全球 AI 研究的重要趋势,Sakana AI 希望凭借其独特方法,在计算资源有限的日本推动这一领域的发展。实验室将招募全球研究人员和工程师,并与社区共享成果。行业递归自我改进Sakana AIRSI LabAI 研究东京推荐理由:RSI 是让 AI 自我进化的前沿方向,做 AI 研究和模型开发的团队值得关注——Sakana AI 试图用更少的算力实现它,这对资源有限的团队尤其有启发。原文
05:40rohanpaul_ai@rohanpaul_ai精选一篇论文提出 SIA(自我改进 AI)框架,让 AI 通过观察任务代理的表现,自动调整外部设置(如提示、工具、重试规则)或更新模型权重(通过 LoRA 适配器)。在三个差异极大的任务(中文法律罪名分类、GPU 内核速度调优、单细胞 RNA 去噪)上,结合设置与权重更新的版本均优于仅改进设置的方法。这表明,除了优化提示和工具,让模型通过任务反馈学习模式能带来额外提升。论文自我改进LoRA任务代理自动化AI 研究推荐理由:这项研究解决了 AI 自我改进依赖人工调参的瓶颈,做自动化 Agent 或模型微调的团队值得关注——SIA 的 LoRA 更新思路能低成本让模型学会任务模式,比只改提示更有效。原文
AITOP5月29日 08:02Opus 4.8发布:编程助手的“静默时刻”,是解放开发者,还是新门槛?🔥Anthropic 把 AI 编程的“确认键”彻底删掉了!Claude Code 搭载全新 Opus 4.8 模型,长时间任务不跑偏、不废话、不中断,像一个资深工程师一样默默干活,从功能开发到漏洞清扫全包圆,你在旁边喝茶等结果就行。过去 AI 写代码三步一问“这样可以吗”,现在它直接交完整交付物……自主编程的最后一层窗户纸,被捅破了。做自动化开发和代码审查的团队,这个模型建议直接上手,效率差距肉眼可见……