13:07Aran Komatsuzaki (论文推介)@arankomatsuzaki精选73°一位研究者分享了使用 Codex 处理开放数学/物理问题的经验,发现并行智能体在需要大量顺序推理的问题上效果有限。真正的超人类能力体现在速度、知识量和可复制性上,而非瞬间解决难题。前沿物理问题比老旧的数学问题更容易被智能体处理,但研究品味仍是瓶颈。智能体擅长在给定方向后推进,但选择问题和判断方向仍需人类。AI产品Codex科研自动化智能体数学推理物理研究推荐理由:做科研自动化的开发者会看到智能体在数学/物理问题上的真实表现——不是万能 oracle,而是高效的科研劳动力,值得了解其能力边界。原文
03:35Google DeepMind@GoogleDeepMind72°Google DeepMind 发布了基于 Co-Scientist 的假设生成系统,旨在帮助研究人员针对开放挑战进行头脑风暴和评估新想法。该系统采用多智能体“想法锦标赛”机制,通过生成、辩论和评估假设,展示哪些方案可行、哪些不可行及其原因。这为科研自动化提供了新工具,有望加速科学发现过程。目前该系统已在 Twitter 上展示,获得初步关注。AI产品假设生成多智能体科研自动化Google DeepMindCo-Scientist推荐理由:科研团队和学术研究者终于有了 AI 驱动的假设生成助手——Co-Scientist 通过多智能体辩论帮你筛选可行方向,做前沿探索的可以直接试试这个思路。原文