Anthropic 呼吁全球放缓前沿 AI，因模型可能接近递归自我改进

精选理由

Anthropic 的警告直指 AI 安全的核心矛盾——递归自我改进可能让所有监管都来不及，做 AI 治理、模型安全或前沿研究的从业者值得认真读一读，这关系到行业未来几年的规则走向。

AI 摘要

Anthropic 发表声明，呼吁建立全球机制来减缓前沿 AI 的发展，因为其自身模型可能正在接近递归自我改进的临界点——即系统能够在没有直接人类控制的情况下帮助构建更强的版本。未来模型在科研、实验、调试和训练设计方面将变得极其擅长，以至于人类不再是主要瓶颈。一旦这种循环启动，进展将从人类主导的工程转向机器辅助的改进，使得所有安全测试、法律和实验室政策都显得滞后。Anthropic 警告，这一跳跃可能在政府、公司和研究人员拥有可信的衡量或约束手段之前到来。验证是难点，因为大型 AI 训练比武器设施更容易隐藏，任何在他人暂停时秘密训练的实验室都可能获得领先优势。

AI 翻译 · 中文

rohanpaul_aiAnthropic just called for a global way to slow frontier AI because its own models may be approaching recursive self-improvement, where a system helps build a stronger version of itself without direct human control. Futur…

Anthropic06-04 16:15原文
The Rundown AI06-04 19:34原文
shao__meng06-05 00:31原文
AI Will06-05 02:11原文
Alex Albert06-04 17:01原文
IT之家06-05 01:16原文
Decoder06-05 08:45原文
SuperTechFans06-06 00:01原文
Gary Marcus06-04 05:31原文
cat06-04 05:38原文

查看原推