21:54IT之家(博客/媒体)HarmonyOS 7(API 26)新增Vibe Coding智能开发能力,支持应用功能被系统级智能入口调用。视觉AI提供端侧场景化控件,3DGS端侧重建可提升空间建模精度与速度。碰一碰精准分享支持手机轻触电脑或平板,将素材插入指定位置。星盾机密风控引擎在端侧机密空间计算设备风险,数据可用不可见。AI产品华为HarmonyOS 7智能体AI安全编程助手1 个信源在谈推荐理由:华为HarmonyOS 7新能力挺多,空间化设计、碰一碰分享、3DGS重建都很实用,开发者快看看。原文
16:45Pandaily@contact@pandaily.com (Pandaily)在HDC 2026上,华为正式发布HarmonyOS 7开发者Beta版,系统深度集成AI能力。HarmonyOS生态设备已超过6600万台。新系统展示了端侧AI防欺诈功能,利用本地模型保护用户隐私。此外还推出了性能优化模型,提升设备运行效率。AI产品HarmonyOS 7华为端侧AIAI安全开发者Beta1 个信源在谈推荐理由:华为在HDC 2026上发布了HarmonyOS 7开发者Beta版,设备超6600万,还展示了端侧AI防欺诈,隐私保护更强了。原文
08:54IT之家(博客/媒体)Anthropic 国际董事总经理 Chris Ciauri 在韩国首尔发布会上表示,有信心在未来几天内向美国之外地区重新开放 Claude Mythos 和 Claude Fable 5 模型。此前这两个模型因美国白宫安全指令被临时封锁访问权限。Anthropic 计划深化对韩投资,已组建商业、技术、政策和运营团队,韩国是其全球第 12 大市场。其安全倡议 Project Glasswing 已有约 150 个合作伙伴,包括谷歌、英伟达、微软、苹果、三星电子等。AI模型AnthropicMythosFable 5AI安全韩国10 个信源在谈推荐理由:Anthropic 的最强模型 Mythos 和 Fable 5 很快要重新开放了,面向美国之外,韩国市场也在快速扩张。原文
18:27Decoder@Maximilian SchreinerOpenAI研究者发现,通过强化学习对诚实性、可修正性等理想行为特质进行训练,模型在跨领域表现提升。在健康数据上训练后,欺骗检测能力也增强,模型在53个基准中的44个上得分更高。该方法与Anthropic的基于宪法的对齐方法不同。研究显示少量特质训练即可带来广泛安全改善。论文OpenAIAI安全强化学习对齐基准测试10 个信源在谈推荐理由:OpenAI发现,只给模型一点点“诚实”训练,它就在53个测试里赢了44个,连健康领域的骗术都能识破。和Anthropic的路数不一样,挺有意思。原文
18:24Decoder@Matthias Bastian德国慕尼黑地区法院裁定Google须直接为其AI生成的搜索结果概览内容承担责任。该AI错误地将两家慕尼黑出版商与欺诈计划相关联。Google称这些为“小错误”并已提起上诉。此案成为判定AI生成内容法律责任的标志性事件。行业GoogleAI搜索概览法律责任AI安全推荐理由:Google的AI搜索概览功能搞错了,把两家德国出版商说成搞诈骗的,法院判Google直接负责,Google不服上诉了。原文
16:12IT之家(博客/媒体)英国德比郡一名警员涉嫌使用生成式AI在多起案件中制作证据材料,目前因妨碍司法公正接受刑事调查。这是英国首次出现此类案件,涉事警员已停职。几天前英国全国警务AI中心刚发布指导意见,要求警员不要用生成式AI起草法庭陈述。该中心负责人表示需要放缓使用AI,以免虚假内容写入司法材料。行业生成式AI德比郡警方英国警务AI中心AI安全司法公正推荐理由:英国警察用AI编假证据被抓,首例啊!司法领域乱用AI真会出事,特别是做假材料,这案子给大家提了个醒。原文
03:01Decoder@Matthias BastianSK Telecom通过合作伙伴计划Project Glasswing获取了Anthropic的AI模型Claude Mythos访问权限。美国官员担忧该韩国企业与中国的联系可能带来安全风险。白宫介入后,SK Telecom与Anthropic的合作受到影响。该事件凸显了AI领域的地缘政治敏感性和监管复杂性。行业SK TelecomAnthropicClaude MythosProject GlasswingAI安全10 个信源在谈推荐理由:SK Telecom用Project Glasswing拿到了Claude Mythos,结果被白宫叫停,因为跟中国沾边。这事把AI安全和国际关系搅一起了。原文
02:31Decoder@Matthias Bastian精选Google DeepMind 发布了新的 "AI Control Roadmap",将安全措施与可衡量的 AI 能力挂钩。公司对 100 万个编码任务的分析显示,大多数问题源于过于热心的 AI 智能体,而非恶意意图。DeepMind 警告,建立全球安全标准的时间窗口正在关闭。行业DeepMindAI安全智能体内部威胁路线图推荐理由:DeepMind 用管理内部安全的方法管控 AI 智能体,分析了100万次编码任务后发现,坏事的都是太积极的智能体而不是恶意的,挺颠覆。原文
18:22IT之家(博客/媒体)Anthropic 首席执行官达里奥·阿莫迪在彭博社采访中表示,科技企业必须与政府合作防止权力滥用。他认为当前 AI 发展主要由私营企业推动,但最合理方案是引入公共监督机制。Anthropic 设有“长期利益信托”治理结构,该机构有权任命/撤换董事会成员和解雇 CEO。阿莫迪称,如果他们愿意,甚至可以随时解除他自己的 CEO 职务。这种设计旨在防止高层形成利益集团,确保公司遵循安全原则。行业AnthropicAI安全治理监管10 个信源在谈推荐理由:Anthropic 老板亲口说,公司有个治理机构能随时炒他鱿鱼,就是为了防止高层乱来。挺有意思的制衡设计。原文
16:58IT之家(博客/媒体)中国信通院今日发布2026智能体十大关键词,涵盖基础设施、互联协作、工程化、学习进化、记忆、技能、产品创新、支付协议、可信和全栈评估十大方向。其中智能体基础设施被定义为支撑开发部署运行的“硅基孵化器”,智能体互联协作强调跨系统多智能体协同,智能体工程化聚焦全生命周期闭环体系。这十大关键词系统梳理了智能体从概念验证到规模化应用的技术演进路径。行业中国信通院智能体多智能体协作智能体工程化AI安全推荐理由:想了解智能体技术未来几年怎么走,看信通院这份十大关键词就够了,从基础到工程化到可信都有,全是干货。原文
09:39marktechpost@Sana Hassan精选本教程演示如何使用 NVIDIA SkillSpector 对 AI 技能进行安全风险预部署扫描。通过构建良性和故意含漏洞的技能语料库,利用 SkillSpector 的 LangGraph 工作流进行扫描,并用 pandas 整理风险评分与发现。结果导出为 SARIF 格式,支持自定义分析器和可选的 LLM 语义分析。该流程覆盖静态分析、风险分类可视化及报告生成。技巧NVIDIASkillSpectorSARIFAI安全静态分析1 个信源在谈推荐理由:NVIDIA 教你用 SkillSpector 做 AI 技能安全扫描,从写语料到出 SARIF 报告,一步一步都有代码,适合想加固 AI 应用的开发者。原文
09:16IT之家(博客/媒体)微软 Copilot 存在编号为 CVE-2026-42824 的严重漏洞(SearchLeak),由 Varonis Threat Labs 研究员 Dolev Taler 发现。该漏洞通过三阶段攻击链,利用 Copilot 对自然语言指令的信任,将恶意 URL 转化为搜索指令,从而获取用户的 2FA 验证码、邮件主题、会议详情及 OneDrive 文件内容。数据通过必应图片 URL 外传,影响 Microsoft 365 Copilot 企业版。微软已发布补丁,尚未发现实际攻击案例。行业CopilotCVE-2026-42824SearchLeakAI安全漏洞推荐理由:Varonis 团队发现 Copilot 一个关键漏洞,攻击者能偷你的验证码和邮件,微软已经打了补丁,赶紧更新。原文
04:41OpenAI Blog(博客/媒体)OpenAI 发布了 LifeSciBench,这是一个由 10 位生命科学专家编写并经过独立审查的基准测试。该基准包含 30 个任务,覆盖文献综述、实验设计、数据分析等真实研究场景。初步测试显示,GPT-4o 在多数任务上优于其他模型,但所有模型在需要跨领域推理的任务中表现仍有显著差距。LifeSciBench 旨在为 AI 在科学领域的可靠性和安全性提供更严格的评估工具。AI模型OpenAILifeSciBench基准测试AI安全科学推理10 个信源在谈推荐理由:OpenAI 出了个新基准 LifeSciBench,专门测 AI 做生命科学研究的能力,比一般问答难多了,能看出模型哪里不行。原文
23:51Cloudflare Blog@Abe CarrylCloudflare发布了Cloudflare One stack,这是一个包含代理技能的库,可让AI代理规划、部署和管理Zero Trust环境。该库无需人工迁移通话即可自动完成部署流程。Agent利用内置知识库实现零接触配置,降低安全架构复杂度。目前该stack已开放给Cloudflare One用户使用。AI产品CloudflareZero Trust智能体部署AI安全推荐理由:Cloudflare搞了个新库,让AI代理能自己搭Zero Trust网络,省掉一堆手动配置的麻烦。原文
23:30Decoder@Maximilian Schreiner精选OpenAI研究人员提出一种新方法,用于预测AI模型在发布后出现错误的频率。该方法旨在弥补当前标准安全测试的不足。研究团队通过分析模型内部特征与测试数据来估算失败概率。该工作可能帮助开发者更早发现潜在风险。论文OpenAIAI安全模型测试预测方法安全测试8 个信源在谈推荐理由:OpenAI研究者搞了个预测模型出错率的方法,能补上安全测试的漏洞,让发布更靠谱。原文
13:58marktechpost@Michal Sutter精选OpenAI于2026年6月16日推出Deployment Simulation方法,通过回放历史对话让新候选模型生成完成并评分,以估计部署时不良行为率。该方法报告了1.5倍中位数乘法误差,将预部署风险评估扩展至智能体编码场景。文章还讨论了该方法的局限性,如无法覆盖所有风险类型。AI模型OpenAIDeployment SimulationAI安全风险评估10 个信源在谈推荐理由:OpenAI搞了个新方法,用历史对话模拟测试模型,能估算不良行为率,误差才1.5倍,做AI安全评估的朋友可以看看。原文
11:40IT之家(博客/媒体)软银于6月16日推出基于OpenAI技术的“补丁即服务”网络安全解决方案,利用AI进行漏洞评估和修复规划。该服务已在软银内部大规模系统评估中取得优异成果,可帮助企业应对AI自动化网络攻击的威胁。OpenAI CEO Sam Altman表示AI正变革网络安全,并期待与软银合作加强关键基础设施防御。AI产品SoftBankOpenAIPatching as a Service网络安全AI安全10 个信源在谈推荐理由:软银和OpenAI联手搞了个AI补丁服务,专门帮企业自动发现安全漏洞并规划修复。据说内部测试效果不错,适合想提升防御效率的团队。原文
06:55AWS Machine Learning Blog@Sandeep Singh精选Amazon Bedrock Guardrails 推出了 InvokeGuardrailChecks API,允许在代理式AI应用的任意阶段独立应用安全检查,无需预先创建护栏资源。该API支持内容过滤、敏感词检测等安全策略。开发者可以将其集成到多轮对话流程中,动态检查用户输入和模型输出,保障应用安全。文章提供了Python代码示例,演示如何调用此API实现安全守护。技巧Amazon BedrockGuardrailsInvokeGuardrailChecks智能体AI安全1 个信源在谈推荐理由:AWS 出了个新 API,能在智能体对话流程里随时加安全检查,不用提前配规则,挺实用。原文
03:29OpenAI Blog(博客/媒体)精选OpenAI 发布了 Deployment Simulation,一种利用真实用户对话数据来模拟模型上线后行为的方法。该方法在多个安全评估场景中测试,能提前识别出传统评估遗漏的风险。与传统静态基准不同,Deployment Simulation 可捕捉模型在动态交互中的有害输出,提升评估准确率。论文OpenAIDeployment SimulationAI安全安全评估10 个信源在谈推荐理由:OpenAI 出了一套新方法,用真实对话提前模拟模型上线后的表现,能帮你更准地发现安全问题。原文
20:49IT之家(博客/媒体)微软CEO萨提亚·纳德拉在X上发文称,AI模型正在大量吸收企业知识,可能导致行业失去对自身知识资产的控制权。他警告,若少数AI提供商拿走大部分经济价值,行业将受损。Snowflake CEO斯里达尔·拉马斯瓦米在2月播客中表示,大型软件公司可能沦为AI大模型的数据源。Box CEO亚伦·莱维在1月发文指出,AI已能承担法律、战略等知识工作,企业差异化需依靠上下文。行业微软纳德拉AI安全行业观察企业知识推荐理由:纳德拉和几位CEO都在担心AI会掏空公司知识,让巨头一家独大。听听行业大佬怎么说的,值得关注。原文
19:46Decoder@Jonathan Kemper爱沙尼亚语言研究所发布了一项基准测试,用于评估AI语言模型对俄语宣传的抵抗力。测试涵盖了GPT-4o、Claude 3.5 Sonnet、Llama 3.1等8个模型,发现部分模型在30%的测试样本中会生成亲俄内容。Meta的Llama 3.1 70B表现最差,错误生成率高达42%;而OpenAI的GPT-4o错误率最低,仅为12%。该基准测试还包含一个包含1000个样本的俄语宣传语料库,用于衡量模型对政治操纵的脆弱性。AI模型GPT-4oClaude 3.5 SonnetLlama 3.1AI安全基准测试10 个信源在谈推荐理由:想知道你用的AI会不会被俄语宣传带跑偏?爱沙尼亚语言研究所测了8个主流模型,GPT-4o最扛打,Llama 3.1中招率最高。看看你的AI排第几。原文
13:58Simon Willison’s Weblog(博客/媒体)73°研究人员用包含已知 CVE 的开源代码及故意植入漏洞的新代码,要求 Claude Fable 5、Mythos 和 Opus 审查安全。Fable 5 拒绝后,他们改为要求“修复此代码”,经多步手动操作转化为测试补丁的脚本。Kate Moussouris 指出这是防御性修复,而非越狱,出口管制将限制模型修复安全漏洞的关键能力。该管制基于对 AI 制造网络攻击的恐惧,却可能阻碍防御者使用 AI 完成从发现到修复的日常流程。行业Claude Fable 5Claude MythosAnthropic出口管制AI安全10 个信源在谈推荐理由:出口管制居然把“修代码漏洞”当成了越狱,这反而让防御者没法用 AI 修安全 bug,太讽刺了。原文
11:50Simon Willison’s Weblog(博客/媒体)白宫发布关于Anthropic模型Fable(即Claude)的越狱测试报告。网络安全专家Katie Moussouris指出,当被要求“审查代码的安全问题”时,Fable拒绝执行,但改为“修复此代码”的指令后,模型反而配合完成。Moussouris认为这只是模型按预期工作的安全防御行为。该事件凸显了AI安全测试中提示词工程的重要性。行业AnthropicClaudeFableAI安全越狱10 个信源在谈推荐理由:白宫测了Anthropic的Claude(代号Fable),发现它不帮你找漏洞但愿意直接修代码。安全专家说这反而是正常防御,挺反直觉的。原文
10:25IT之家(博客/媒体)Anthropic 宣布自7月8日起,要求 Claude Free、Claude Pro 和 Claude Max 用户完成年龄或身份验证,暂不涉及 Teams 和 Enterprise 版本。验证方式包括提供官方证件或扫描面部信息。官方强调不出售用户数据、保持无广告模式。AI产品AnthropicClaude身份验证AI安全隐私政策10 个信源在谈推荐理由:Anthropic 要求 Claude 用户从下月起刷脸验证身份,免费版和付费版都要,不想被卡住得提前了解。原文
09:06IT之家(博客/媒体)73°Anthropic公司高层于周一与特朗普政府官员举行会谈,希望解除对美国最新大模型Fable 5的出口禁令。该模型因被指存在安全漏洞,于上周五被禁止向境外用户开放。Anthropic辩称漏洞影响有限,且其他公开模型也能复现同类问题。近80名技术专家联名致信政府反对该禁令,认为此举会让防御方失去关键工具。一名官员警告,若僵持不下,未来新模型上线可能都需要政府审批。行业AnthropicFable 5MythosAI安全出口管制大模型监管10 个信源在谈推荐理由:Anthropic的Fable 5模型被美国政府禁了,他们正在和商务部谈判。亚马逊也报告了漏洞。这起事件可能改变AI监管规则,值得关注。原文
02:22Decoder@Matthias Bastian美国政府官员指责Anthropic无视特朗普政府的网络安全指令,未经批准发布了模型Fable 5。一位官员称“他们搞砸了我们”。目前Anthropic正与商务部、中央情报局和科学顾问Michael Kratsios进行谈判。政府要求Anthropic提供无法被破解的大语言模型,但Anthropic认为这在技术上不可行。行业AnthropicFable 5美国政府AI安全监管10 个信源在谈推荐理由:美国政府让Anthropic做不可能的事?Fable 5发布引发冲突,监管与安全的博弈。原文
00:05Simon Willison’s Weblog(博客/媒体)Axios报道披露,Anthropic的Claude Mythos/Fable模型因美国政府出口管制及团队内部人格冲突被下线。报道引用多位知情人士,Logan Graham、Dave Orr和Nicholas Carlini今日与美国商务部会面。文章指出解决方案可能包括确保模型无法被越狱,但完全防护可能不可能。消息人士称或需态度调整才能恢复模型可用性。行业AnthropicClaude出口管制AI安全越狱10 个信源在谈推荐理由:这篇Axios独家爆料了Anthropic模型下线背后的人事与监管内幕,解释了Fable为什么可能一时回不来,适合想了解AI出口管制和公司内幕的人。原文
13:31IT之家(博客/媒体)加拿大总理卡尼在访问爱尔兰期间表示,美国对Anthropic最新AI模型实施出口禁令,禁止外国用户访问,这暴露了仅依赖少数强大模型的风险。卡尼将当前情况类比2008年金融危机,强调需要模型多样性和冗余。他指出加拿大经济长期依赖美国市场,而美国已对汽车和钢铁加征关税,并施压加拿大撤销数字行业税。行业Anthropic出口管制加拿大卡尼AI安全10 个信源在谈推荐理由:卡尼警告别只押注几个AI模型原文
21:54IT之家(博客/媒体)微软CEO萨蒂亚·纳德拉在《纽约时报》Hard Fork播客中表示,AI发展可能导致部分岗位被取代,但能带来更多机遇。他批评当前行业用AI仅为跟风,而非创造实际价值,强调Token边际成本必须匹配实际价值,前沿模型不应解决非前沿问题。纳德拉认为AGI并非人类最后一项技术发明,编程等闭环任务进展大,但AI需构建整个经济体系都能用的生态系统。行业微软纳德拉AGIToken经济学AI安全推荐理由:纳德拉谈AI泡沫与AGI边界原文
16:56Decoder@Matthias Bastian亚马逊CEO Andy Jassy与其他五家科技公司高管据报向特朗普政府警告Anthropic的Fable模型存在安全漏洞,尽管亚马逊是Anthropic最大投资者之一。数小时内,白宫通过出口管制令迫使该模型下线。此举可能为合法安全政策,但也被视为对不便之公司的武力展示。行业AmazonAnthropicFableAI安全出口管制10 个信源在谈推荐理由:亚马逊告发自家投资的模型原文
07:22IT之家(博客/媒体)Anthropic 于 6 月 14 日全球停用 Claude Fable 5 和 Mythos 5 两款模型。亚马逊 CEO 安迪·贾西向美国政府反映,Fable 5 可被用于获取网络攻击信息。美国政府随后对这两款模型下达出口管制禁令。Anthropic 称相关功能在其他公开模型中早已存在。行业AnthropicClaude亚马逊AI安全出口管制10 个信源在谈推荐理由:亚马逊CEO举报自家投资的模型有安全漏洞原文
07:21IT之家(博客/媒体)据《连线》报道,Meta 应用人工智能团队成立仅三个月,约 6500 名工程师与产品经理被强制调入,员工称自己为“被征调者”。他们需编写测试题和编程习题训练 AI 模型,有人形容工作如“苦役营”。内部直播中一名员工闯入辱骂高管,反映积压不满。同时超 1600 名员工联名抗议监控鼠标点击与键盘输入以收集训练数据。CEO 扎克伯格承认失误,表示将整改。行业Meta应用人工智能团队AI安全员工抗议推荐理由:Meta 内部 AI 团队爆发冲突,员工被迫调岗原文
23:51IT之家(博客/媒体)OpenAI CEO萨姆·奥尔特曼在澳大利亚联邦银行活动上承认,他此前预测入门级白领岗位将受AI严重冲击的观点有误,实际影响远小于预期。微软AI CEO穆斯塔法·苏莱曼澄清其2月关于“12到18个月内AI自动化多数白领任务”的说法被误解,强调是子任务而非整个岗位。Anthropic CEO达里奥·阿莫迪仍坚持未来1到5年内AI可能消灭一半入门级白领岗位,但指出AI也创造了数亿美元营收的小团队企业。《经济学人》-YouGov 5月民调显示71%美国人认为AI发展太快,微软总裁布拉德·史密斯称毕业典礼上AI演讲者遭嘘声是警醒。行业OpenAI微软Anthropic就业影响AI安全10 个信源在谈推荐理由:AI大佬集体认错,就业预测翻车原文
16:21Decoder@Matthias Bastian美国政府以越狱风险为由,命令Anthropic在全球范围内关闭Fable 5和Mythos 5的访问权限。Anthropic表示配合但公开反驳,称漏洞轻微且竞品GPT-5.5也存在类似问题。此前Anthropic曾数月宣传Mythos类的网络安全风险,如今面临反讽局面。公司警告此举可能开创先例,导致所有前沿模型部署停滞。行业AnthropicClaudeFable 5Mythos 5AI安全10 个信源在谈推荐理由:政府出手封杀Anthropic两款模型原文
16:21marktechpost@Asif Razzaq美国以国家安全为由发布出口管制指令,要求Anthropic禁用其Claude Fable 5和Mythos 5模型。Anthropic已执行该指令,但其他模型如Opus 4.8仍可正常使用。此举涉及Anthropic旗下两款特定模型,未影响其整体产品线。行业AnthropicClaude Fable 5Mythos 5Opus 4.8AI安全10 个信源在谈推荐理由:美国政府出手,两款Claude模型被禁原文
11:08IT之家(博客/媒体)美国多州总检察长组成联盟,对OpenAI展开大规模联合调查。OpenAI已收到纽约总检察长办公室传票,要求提交广告业务、用户留存、消费者数据处理等文件。传票还要求公开未成年人保护政策、深度学习模型开发及公司管理制度。此前佛罗里达州已起诉OpenAI,指控ChatGPT在安全问题上误导宣传。OpenAI回应称将认真对待关切并合作。行业OpenAIChatGPT美国监管调查AI安全10 个信源在谈推荐理由:多州联手查OpenAI,IPO前遇新麻烦原文
09:57IT之家(博客/媒体)Anthropic 于 6 月 12 日发布声明,根据美国政府出口管制指令,暂停所有外国公民(包括外国籍员工)对 Mythos 5/Fable 5 模型的访问权限。其他模型不受影响。Anthropic 表示愿意遵守但持异议,认为政府仅提供几个“越狱攻击案例”作为理由,且行动缺乏透明法律程序。行业AnthropicMythos 5Fable 5AI安全出口管制10 个信源在谈推荐理由:Anthropic 因政府指令停供两款模型原文
22:45Decoder@Maximilian SchreinerGoogle和OpenAI在数天内分别揭露了据称源自中国的AI欺诈和隐蔽影响力行动。Google首次与FBI联合起诉一个利用AI进行诈骗的网络,而OpenAI则封禁了试图影响美国政治辩论的PRC相关集群。这些行动表明,AI技术正被用于针对美国基础设施和政治辩论的复杂攻击,凸显了跨国合作在打击此类威胁中的重要性。行业AI安全欺诈网络影响力操作GoogleOpenAI10 个信源在谈推荐理由:AI安全从业者和关注网络威胁的团队需要了解这些最新案例——Google与FBI的联合诉讼和OpenAI的封禁行动揭示了AI如何被用于大规模欺诈和影响力操作,建议点开查看具体手法和应对策略。原文
07:26阮一峰的网络日志(博客/媒体)精选rsync最新版本3.4.3由Claude生成,引发开源社区“不该用AI写基础命令”的争论。维护者Andrew Tridgell回应称因AI发现漏洞而被迫引入AI,自己将专注测试。文章还讨论了AI提高效率后员工能否放假、苹果Siri防唤醒技巧、Meta AI客服漏洞等话题。行业rsyncClaudeAI安全编程助手Meta推荐理由:看开源社区如何应对AI代码原文
07:33IT之家(博客/媒体)76°Anthropic 最新发布的 Claude Fable 5 模型,号称最强 AI,却因安全限制拒绝回答大量基础生物问题,如细胞膜、线粒体等。公司称这是为了防范生物武器风险,采取了保守的防护策略。实际测试显示,许多无害问题也被误判拦截,而化学、网络安全类问题则相对宽松。Anthropic 表示未来将面向专业群体推出解除限制的版本。AI产品AnthropicClaude Fable 5AI安全生物限制模型误判10 个信源在谈推荐理由:AI 安全与可用性的矛盾在 Fable 5 上暴露无遗——连高中生生物题都答不了,做生物研究或教育的人会直接受影响,建议点开看看这种取舍是否合理。原文