12:45Artificial Analysis@ArtificialAnlys83°Anthropic 发布了 Claude Fable 5,这是首个公开可用的 Mythos 级模型,在代理型真实世界知识工作基准测试 GDPval-AA 中排名第一。该模型与 Claude Mythos 5 共享底层模型,但增加了针对网络安全、生物、化学和蒸馏相关有害查询的安全防护。Fable 5 还引入了回退机制,可将标记的查询路由到 Claude Opus 4.8 等第二模型。在 GDPval-AA 上,Fable 5 得分 1932,使 Anthropic 模型占据前四名中的三席。回退发生在不到 5% 的会话中,性能稳定。AI模型Claude Fable 5Mythos 级模型代理型基准安全防护回退机制10 个信源在谈推荐理由:做 AI 代理或知识工作自动化的团队值得关注——Claude Fable 5 在真实世界任务基准上登顶,且安全回退机制降低了误判风险,可以直接评估是否适合你的场景。原文
22:34IT之家(博客/媒体)Anthropic 在发布 Claude Fable 5 后,原本计划对试图用该模型训练竞争性 AI 的研究人员暗中降低模型性能,引发 AI 研究社区强烈反对。Anthropic 随后道歉并调整政策,将安全防护措施改为对用户可见,明确提醒用户系统将拒绝请求或转至较弱模型。批评者认为,暗中降智行为越界,可能导致先进 AI 研究被少数头部实验室垄断。Claude 智能体已成为许多开发者的常用工具,开源 AI 项目也依赖它。行业AnthropicClaude Fable 5安全防护AI 研究社区模型降智10 个信源在谈推荐理由:Anthropic 的暗中降智政策触及了 AI 研究社区的底线——做前沿模型开发或依赖 Claude 的团队,需要了解这次调整如何影响你的工作流,建议点开看看具体变化。原文
10:02OpenRouter@OpenRouterAIOpenRouter 宣布其平台新增 Google Model Armor 和 LakeraAI Guard 两项安全防护功能,目前处于测试阶段。这两项功能旨在为 AI 模型调用提供额外的安全层,防止恶意输入和输出。用户需要联系 OpenRouter 申请访问权限。这对于使用 OpenRouter 调用多种 AI 模型的开发者来说,是一个提升应用安全性的重要更新。AI产品安全防护OpenRouterGoogle Model ArmorLakeraAI GuardAI 安全推荐理由:OpenRouter 用户终于有了原生安全防护,做 AI 应用开发的团队可以申请试用,避免模型被注入攻击。原文