Anthropic 研究:Claude 在科研决策中 64% 优于人类

AI research is a series of next-step decisions. We looked at sessions where a human researcher took ...

精选理由

科研人员常因路径依赖错过更好方案,Claude 的决策能力提升意味着 AI 能成为靠谱的科研副驾驶,做实验规划或论文研究的团队值得关注这个趋势。

AI 摘要

Anthropic 发布了一项研究,分析 AI 在科研决策中的表现。他们选取了人类研究人员在实验中走错方向的案例,将实验过程展示给 Claude,并询问它下一步该怎么做。结果显示,Claude 的 Mythos Preview 版本在 64% 的情况下做出了比人类更好的决策,而 2024 年这一比例仅为 22%。这表明 AI 在辅助科研决策方面取得了显著进步,有望帮助研究人员避免错误路径,加速科学发现。

AI 翻译 · 中文

Anthropic 发布了一项研究,分析 AI 在科研决策中的表现。他们选取了人类研究人员在实验中走错方向的案例,将实验过程展示给 Claude,并询问它下一步该怎么做。结果显示,Claude 的 Mythos Preview 版本在 64% 的情况下做出了比人类更好的决策,而 2024 年这一比例仅为 22%。这表明 AI 在辅助科研决策方面取得了显著进步,有望帮助研究人员避免错误路径,加速科学发现。

AnthropicAI research is a series of next-step decisions. We looked at sessions where a human researcher took a wrong turn, showed Claude the session up to that point, and asked it what to do next. Mythos Preview improved on human