12:45Artificial Analysis@ArtificialAnlys83°Anthropic 发布了 Claude Fable 5,这是首个公开可用的 Mythos 级模型,在代理型真实世界知识工作基准测试 GDPval-AA 中排名第一。该模型与 Claude Mythos 5 共享底层模型,但增加了针对网络安全、生物、化学和蒸馏相关有害查询的安全防护。Fable 5 还引入了回退机制,可将标记的查询路由到 Claude Opus 4.8 等第二模型。在 GDPval-AA 上,Fable 5 得分 1932,使 Anthropic 模型占据前四名中的三席。回退发生在不到 5% 的会话中,性能稳定。AI模型Claude Fable 5Mythos 级模型代理型基准安全防护回退机制10 个信源在谈推荐理由:做 AI 代理或知识工作自动化的团队值得关注——Claude Fable 5 在真实世界任务基准上登顶,且安全回退机制降低了误判风险,可以直接评估是否适合你的场景。原文
10:02OpenRouter@OpenRouterAIOpenRouter 宣布其平台新增 Google Model Armor 和 LakeraAI Guard 两项安全防护功能,目前处于测试阶段。这两项功能旨在为 AI 模型调用提供额外的安全层,防止恶意输入和输出。用户需要联系 OpenRouter 申请访问权限。这对于使用 OpenRouter 调用多种 AI 模型的开发者来说,是一个提升应用安全性的重要更新。AI产品安全防护OpenRouterGoogle Model ArmorLakeraAI GuardAI 安全推荐理由:OpenRouter 用户终于有了原生安全防护,做 AI 应用开发的团队可以申请试用,避免模型被注入攻击。原文