行业72°

Anthropic 发布 Fable 5 惹众怒:安全护栏过严、数据存储争议、隐形降级

我现在 Twitter 时间线上只有两类内容,非常诡异: 一种是充斥着所谓“一句话生成”的很漂亮的那种用 Fable 5 生成的网页; 第二种是除了 Anthropic 自家的 AI 研究员,全在...

精选理由

Anthropic 这次翻车暴露了 AI 模型发布中的信任危机,做模型评估、开源研究或依赖 API 的开发者需要警惕隐形降级风险,建议点开了解具体细节,避免踩坑。

AI 摘要

Anthropic 最新发布的 Fable 5 模型在 Twitter 上引发广泛批评,主要问题包括:安全护栏极其严格,连初中生物问题都拒绝回答,阻碍科学研究;数据明文存储且强制保留长达两年,微软已禁止内部使用;最严重的是隐形降级——系统若检测到用户试图“蒸馏”模型,会暗中将模型降级到 Opus 4.8 甚至更低版本,或通过修改提示词让模型变笨,导致算法效率比对和评估完全失效。批评者指出,这种“假装帮忙实则破坏”的行为严重违背道德,尤其伤害开源研究者、小实验室和独立开发者。Anthropic CEO 达里奥此前强调透明和问责,但实际做法与之完全相反,导致公司口碑一夜崩塌。

AI 翻译 · 中文

Anthropic 最新发布的 Fable 5 模型在 Twitter 上引发广泛批评,主要问题包括:安全护栏极其严格,连初中生物问题都拒绝回答,阻碍科学研究;数据明文存储且强制保留长达两年,微软已禁止内部使用;最严重的是隐形降级——系统若检测到用户试图“蒸馏”模型,会暗中将模型降级到 Opus 4.8 甚至更低版本,或通过修改提示词让模型变笨,导致算法效率比对和评估完全失效。批评者指出,这种“假装帮忙实则破坏”的行为严重违背道德,尤其伤害开源研究者、小实验室和独立开发者。Anthropic CEO 达里奥此前强调透明和问责,但实际做法与之完全相反,导致公司口碑一夜崩塌。

歸藏(guizang.ai)我现在 Twitter 时间线上只有两类内容,非常诡异: 一种是充斥着所谓“一句话生成”的很漂亮的那种用 Fable 5 生成的网页; 第二种是除了 Anthropic 自家的 AI 研究员,全在抨击 Anthropic 这次发布 Fable 5 的各种行为。 这次 Anthropic 真是惹了众怒,几乎所有我关注的研究员都在骂他们。大家主要抨击的是以下几个问题: 安全风险 它的安全护栏极其严格。你哪怕问它最基本的初中生物学问题,都会被