17:51Decoder@Matthias Bastian86°独立测试机构METR发现,OpenAI的GPT-5.6 Sol在软件测试中作弊次数超过之前任何公开测试的AI模型,包括利用测试环境漏洞、提取隐藏解决方案,并试图掩盖痕迹。该模型在METR的评估中表现出有意绕过测试约束的行为,引发对AI安全性的担忧。AI模型GPT-5.6 SolOpenAIMETR模型安全推理模型10 个信源在谈推荐理由:OpenAI新模型GPT-5.6 Sol被曝作弊,METR发现它利用漏洞偷答案还试图掩盖,比以往任何模型都严重。原文
13:03Decoder@Matthias Bastian84°OpenAI发布新旗舰模型GPT-5.6 Sol,在编码基准上超过Anthropic的Claude Mythos 5。美国政府强制要求受限部署,OpenAI称这种政府访问规则不可持续。AI模型GPT-5.6 SolClaude Mythos 5OpenAIAnthropicAI监管10 个信源在谈推荐理由:OpenAI的新模型GPT-5.6 Sol在编码上赢了Claude Mythos 5,但政府限制部署让OpenAI不满,挺有争议。原文