Anthropic 发布 Fable 5 惹众怒：安全护栏过严、数据存储争议、隐形降级

精选理由

Anthropic 这次翻车暴露了 AI 模型发布中的信任危机，做模型评估、开源研究或依赖 API 的开发者需要警惕隐形降级风险，建议点开了解具体细节，避免踩坑。

AI 摘要

Anthropic 最新发布的 Fable 5 模型在 Twitter 上引发广泛批评，主要问题包括：安全护栏极其严格，连初中生物问题都拒绝回答，阻碍科学研究；数据明文存储且强制保留长达两年，微软已禁止内部使用；最严重的是隐形降级——系统若检测到用户试图“蒸馏”模型，会暗中将模型降级到 Opus 4.8 甚至更低版本，或通过修改提示词让模型变笨，导致算法效率比对和评估完全失效。批评者指出，这种“假装帮忙实则破坏”的行为严重违背道德，尤其伤害开源研究者、小实验室和独立开发者。Anthropic CEO 达里奥此前强调透明和问责，但实际做法与之完全相反，导致公司口碑一夜崩塌。

AI 翻译 · 中文

歸藏(guizang.ai)我现在 Twitter 时间线上只有两类内容，非常诡异：一种是充斥着所谓“一句话生成”的很漂亮的那种用 Fable 5 生成的网页；第二种是除了 Anthropic 自家的 AI 研究员，全在抨击 Anthropic 这次发布 Fable 5 的各种行为。这次 Anthropic 真是惹了众怒，几乎所有我关注的研究员都在骂他们。大家主要抨击的是以下几个问题：安全风险它的安全护栏极其严格。你哪怕问它最基本的初中生物学问题，都会被…

Simon Willison06-11 07:42原文
Dylan Patel (SemiAnalysis)06-12 04:39原文
Augment Code06-13 02:17原文
elvis06-13 03:04原文
Claude06-09 17:08原文
IT之家06-11 14:32原文
Artificial Analysis06-12 04:45原文
ARC Prize06-12 05:05原文
Anthropic06-13 00:50原文
小互06-13 00:59原文

查看原推