09:34Ate-a-Pi@svpino精选Lemma 推出 FARS(全自动研究系统)模式,通过四个专门智能体(构思、规划、实验、写作)实现端到端的 AI 研究自动化。该系统无需人类干预即可运行完整研究循环,从提出假设到撰写论文。FARS 通过共享文件系统协调智能体,支持并行运行多个研究线程,使单个研究者一周内能完成传统实验室一年的工作量。这有望彻底改变当前研究效率低下的现状,解决文献综述耗时、路径选择风险高等痛点。AI产品多智能体系统自动化研究LemmaFARS假设验证推荐理由:AI 研究者终于有了能并行跑假设验证的工具——FARS 把实验室一年的工作量压缩到一周,做学术或工业研究的团队可以直接用它加速探索。原文
23:02rohanpaul_ai@rohanpaul_ai72°Meta、斯坦福、谷歌等顶级实验室联合提出AutoResearchClaw,一种将自动化科研从“生产流水线”转变为“受控循环”的新框架。该框架允许AI在研究中失败、恢复并在适当时机向人类求助,将失败视为证据而非错误。在ARC-Bench基准上,AutoResearchClaw比AI Scientist v2提升54.7%,尤其在结果分析环节表现突出。实验显示,完全自主的科研接受率仅25%,而人类协作模式(CoPilot)达到87.5%,说明过度监督和缺乏判断都会损害科研质量。论文揭示了当前AI科研系统的关键边界:机器能验证数字的真实性,但人类仍能识别实验是否在问正确的问题。论文AI科研AutoResearchClaw人机协作自动化研究失败恢复推荐理由:做AI科研自动化的团队会发现,这个框架把失败变成了系统的一部分,而不是bug——CoPilot模式87.5%的接受率值得所有做AI Scientist的人点开看看。原文
01:10AlphaSignal@AlphaSignalAI70°Hugging Face 开源了一个 CLI 智能体,能自动执行机器学习工程师的完整研究循环:从阅读论文、追踪引用,到拉取数据集、编写训练脚本,再到启动 GPU 任务并迭代优化。在科学推理任务中,它训练 Qwen3-1.7B 将 GPQA 得分从 10% 提升至 32%,超越 Claude Code 的 22.99%。在医疗领域,它因公开数据集质量不足,自动生成 1100 个合成样本并上采样 50 倍,在 HealthBench 上比 Codex 高出 60%。该智能体还具备自主诊断失败评估、恢复训练的能力,以 CLI 和 Web 应用形式提供,甚至可在手机上运行。AI产品Hugging FaceCLI 智能体开源/仓库自动化研究模型训练推荐理由:Hugging Face 这个开源智能体把 ML 研究全流程自动化了,做实验的团队可以直接用它跑论文复现和模型训练,省掉大量手动调参和写脚本的时间。原文