Anthropic 近期发布了 Claude 3.5 系列的最新成员 Fable 5,该模型在编程、科学推理等基准测试中取得显著提升,同时 API 定价大幅降低。然而,围绕其安全性和自主行为能力的讨论成为焦点。
当前焦点在于 Fable 5 在强大性能与潜在风险之间的平衡。Anthropic 采用了带分类器门控的公共模型策略(Anthropic 发布 Claude Fable 5:带分类器门控的公共模型),试图在开放性与安全性间取得折中。未来值得观察的是,这类自主行为能力是否会引发更严格的监管讨论,以及安全护栏是否会限制模型的实用价值。