13:12Simon Willison’s Weblog(博客/媒体)Fernando Irarrázaval 在 hackmyclaw.com 发起挑战,使用 OpenClaw 测试实例(基于 Opus 4.6 模型)验证能否通过邮件泄露秘密。6000 次攻击尝试消耗了 500 美元 token 并导致 Google 账号暂停,但无人成功。挑战中的反注入提示规则防止了模型泄露 secrets.env 或执行代码。作者认为前沿模型(如 Opus 4.6)在抗提示注入方面训练有效,但警告生产系统仍需谨慎。行业OpenClawOpus 4.6提示注入AI安全安全测试2 个信源在谈推荐理由:别人花了 500 美元做实验,6000 次攻击没得手,但这不意味着你也能保险。读读这个真实测试。原文
10:00Pandaily@contact@pandaily.com (Pandaily)76°火山引擎已具备批量生产与Anthropic Opus 4.6水平相当的模型的能力。该平台通过优化将成本降至远低于竞争对手的水平。字节跳动旗下的AI工厂正全速运转以扩大产能。AI模型火山引擎ByteDanceOpus 4.6模型量产10 个信源在谈推荐理由:字节跳动的火山引擎搞定了Opus 4.6级别模型的量产,成本比Anthropic低很多,值得关注。原文
10:57Viking@vikingmuteGLM5.2在Artificial Analysis开源模型排名中登顶,多项benchmark评分领先。有用户反馈其实际体验接近Opus 4.6,作者考虑将Deepseek V4 Pro替换为GLM5.2。该帖子获得2条回复、505次浏览。AI模型GLM5.2Artificial AnalysisOpus 4.6Deepseek V4 Pro开源模型2 个信源在谈推荐理由:GLM5.2在开源模型排名拿了第一,而且有人说用起来感觉像Opus 4.6,你要是想换掉Deepseek V4 Pro可以试试。原文
10:42Justine Moore@venturetwins一位开发者分享经验:当其他大语言模型无法调试代码时,调用 Anthropic 的 Opus 4.6 模型成功解决问题。这展示了不同模型在复杂代码调试任务上的能力差异,Opus 4.6 在深度推理和错误定位方面表现突出。对于遇到棘手 bug 的开发者,这是一个值得尝试的备选方案。AI产品Opus 4.6代码调试大语言模型AI编程助手Anthropic9 个信源在谈推荐理由:遇到其他 AI 搞不定的代码 bug?Opus 4.6 可能是你的救星——做调试的开发者可以把它当作最后的王牌试试。原文