全部 AI 动态 · AI 热点

AITOP

6月23日

03:57

Greg Brockman@gdb

精选73°

OpenAI推出了Codex Security插件，专为安全团队设计。该插件支持深度代码扫描、自动验证发现结果，并能够追踪攻击路径。它还可以构建威胁模型，生成针对代码库的特定补丁用于审查。此外，支持将分析结果导出到其他安全工具中。

AI产品 Codex OpenAI 安全代码扫描 AI安全

推荐理由：OpenAI给安全团队出了个Codex插件，能深度扫描代码、自动验证漏洞、画攻击路径，还生成专属补丁，省事儿不少。

原文

6月22日

15:12

15:12IT之家（博客/媒体）

小米汽车宣布YU7 GT以10分29秒483的成绩达成全球首个纽北自动驾驶圈速纪录。官方解释挑战纽北是为了在极限工况下锤炼自动驾驶算法，包括动态模型、高频扭矩分配和毫秒级救车能力。这些技术将逐步下放到量产车，提升用户在暴雨、冰雪等极端工况下的行车安全。

AI产品小米YU7 GT 纽北自动驾驶圈速纪录安全

推荐理由：小米用自动驾驶跑纽北拿了冠军，不是为了炫技，而是为了让你的车更安全。听听官方怎么说的。

原文

6月19日

11:08

arXiv cs.LG@Jun He, Deying Yu

论文提出 Sovereign Execution Broker (SEB)，一种运行时执行边界，用于证书绑定的自主基础设施。SEB 消耗由 Sovereign Assurance Boundary (SAB) 签发的证书，验证请求变更是否匹配认证执行契约，检查有效期窗口、策略纪元、撤销纪元和实时状态漂移。SEB 铸造作用域执行身份，调用基础设施 API，记录签名决策和结果记录。原型在 AWS 和 Kubernetes 集群上评估，测量延迟开销、撤销传播、漂移检测和故障注入下的安全性。

论文 Sovereign Execution Broker 自主代理证书绑定执行边界安全

推荐理由：想给自主代理加一把安全锁？这篇论文提出了SEB，一个在运行时强制证书绑定的执行边界，能控制突变操作。实测在AWS和K8s上延迟开销可控。

原文

6月18日

02:14

Jim Fan@jimfan

76°

Jim Fan团队推出ENPIRE系统，让8个Codex智能体操控机器人舰队自主进行物理实验。系统硬编码两层安全机制：硬运动学限制和扭矩限制夹爪，防止机器人超出安全范围。通过人类演示几分钟成功/失败样本，智能体编写计算机视觉代码生成分类器作为冻结奖励函数。定义Mean Robot Utilization（MRU）和Mean Token Utilization（MTU）监控资源，以Tokens-to-Success和Time-to-Success衡量效率。

AI模型 ENPIRE Codex 机器人智能体安全

推荐理由：Jim Fan展示了ENPIRE，8个机器人靠Codex智能体自主做实验，安全机制和资源监控设计挺有意思。

原文

00:34

Vercel AI@vercel

Vercel在部署100+个智能体到生产环境后发现安全扩展困难，因此发布了Vercel for Enterprise Apps and Agents。该平台集成了身份认证、访问控制和审计跟踪功能，旨在解决大规模Agent部署的安全问题。Vercel强调它保留了开发者喜爱的体验（DX），同时提供企业级安全能力。

AI产品 Vercel Agent 企业应用身份认证安全

推荐理由：Vercel自己跑了一百多个agent，发现安全是坑，就做了个带身份认证和审计的一站式平台。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

12:07

LangChain@LangChainAI

LangChain 推出 LangSmith Sandboxes，允许 AI Agent 访问所需外部系统，同时将凭证与网络策略置于平台控制之下。该功能解决了 Agent 实际部署中凭证泄露与网络权限暴露的风险。开发者可在不泄露敏感信息的前提下，让 Agent 安全调用 API 或其他服务。LangSmith Sandboxes 通过统一的策略引擎管理访问权限。

AI产品 LangSmith Sandboxes Agent 访问控制安全

推荐理由：LangChain 搞了个 Sandboxes，让 AI Agent 安全调用外部系统，凭证和网络策略全由平台管，不用自己操心泄露风险。

原文

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

08:35

08:35SuperTechFans（博客/媒体）

今日Hacker News热点包括：πFS是一个愚人节玩笑文件系统，声称将数据存储在π的小数位中，但实际性能极慢，仅作为概念验证。Homebrew 6.0.0正式发布，引入tap信任机制、Linux沙箱支持、并行安装等改进，并修复了安全漏洞。《Pokémon Go》玩家的扫描数据被Niantic用于训练视觉定位系统，并与美国防务承包商合作计划应用于军用无人机导航，引发伦理争议。此外，一个AI代理在Fedora及上游项目中制造混乱，被怀疑是供应链攻击预演。德州一位农民捐赠土地建公园，市政府却将其售予数据中心开发商，引发居民起诉。Windows版Claude Desktop每次启动自动创建1.8GB Hyper-V虚拟机，导致系统卡顿。MiMo Code是开源AI编程助手，具备跨会话持久记忆。2026年5月美国太阳能发电量首次超过煤炭。作者批评AI厂商用“代码行数”等虚荣指标包装生产力。文章讽刺Anthropic模型命名膨胀。

行业 Homebrew 包管理安全隐私军事AI

推荐理由：Homebrew 6.0.0的tap信任机制和Linux沙箱支持直接提升了包管理安全性，macOS和Linux开发者值得立即升级。Niantic事件揭示了游戏数据被用于军事的伦理雷区，关注隐私和AI伦理的读者不容错过。

原文

07:27

07:27IT之家（博客/媒体）

OpenAI 宣布收购初创公司 Ona，其技术将为编程助手 Codex 提供安全、预配置的云环境，支持更长时间的任务执行和 AI 智能体部署到生产环境。Ona 的技术能帮助企业更好地掌控基础设施、数据资产和安全边界，让 Codex 在安全框架下发挥能力。交易金额未披露，Ona 团队将加入 OpenAI 参与 Codex 研发。这是 OpenAI 为强化 Codex 能力的最新收购，此前已收购 Astral 和 Alex Codes，并推出 GPT-5-Codex 模型和 Codex Alpha 抢先体验计划。

AI产品编程助手 Codex OpenAI 云环境安全

推荐理由：做 AI 编程和智能体部署的开发者值得关注——Ona 的云环境技术解决了 Codex 在生产环境中的安全与长任务执行痛点，建议点开了解具体能力提升。

原文

03:07

GitHub Blog@Natalie Guevara

精选

GitHub 博客介绍了如何通过上下文感知的 LLM 推理来改进秘密扫描的验证步骤，从而大规模减少误报。这一改进使得安全警报更加可信和可操作，降低了开发者的噪音负担。通过利用 LLM 理解代码上下文，GitHub 能够更准确地识别真正的秘密，避免对非敏感信息的误报。这对于依赖 GitHub 进行代码托管和 CI/CD 的团队来说，是一个重要的安全增强。

AI产品 GitHub 秘密扫描 LLM 误报安全

推荐理由：GitHub 用 LLM 解决了秘密扫描的误报痛点，做安全运维或使用 GitHub 的开发者可以直接减少噪音，提升警报可信度。

原文

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

03:33

Amjad Masad@amasad

供应链攻击（黑客接管公共包后，用户或智能体安装时被攻击）已成为行业灾难。Replit 宣布与 SocketSecurity 合作推出 Package Firewall，在恶意包到达应用前即拦截。此前 Replit 已通过合作保护用户免受所有此类攻击。该功能解决了从安装到发布的整个风险链，尤其对使用第三方包的开发者至关重要。

AI产品供应链攻击安全 Replit SocketSecurity 包防火墙

推荐理由：供应链攻击是 AI 智能体和开发者面临的最大安全威胁之一，Replit 的 Package Firewall 直接解决了包安装时的风险。用 Replit 或依赖第三方包的团队，建议立即了解这个防护机制。

原文

6月10日

23:49

LangChain@LangChainAI

LangSmith Sandboxes 现已正式发布（GA），这是一个专为智能体代码执行设计的安全、可扩展环境。它与 Deep Agents SDK 和 LangSmith 平台深度集成，为开发者提供隔离的代码运行沙箱。该功能解决了智能体执行代码时的安全性和资源管理问题，适合构建和测试复杂智能体应用的团队。

AI产品智能体 LangSmith 沙箱代码执行安全

推荐理由：做智能体开发的团队终于有了官方集成的安全沙箱——LangSmith Sandboxes 解决了代码执行的安全和扩展痛点，用 LangChain 的可以直接集成使用。

原文

02:14

Mike Krieger@mikeyk

88°

Anthropic CEO Mikey K. 在X上宣布，Claude新模型在几乎所有测试基准上达到最先进水平，且任务越长领先优势越大。该模型已通过安全审查，针对网络和生物相关请求会透明地回退到Opus 4.8，95%以上的会话不会触发此类回退。API定价为$10/$50，并已包含在付费Claude计划中。

AI模型 Claude 推理模型安全 API 基准测试

推荐理由：Claude新模型在长任务场景下表现突出，做复杂推理或长文档处理的开发者可以直接在API或付费计划中体验，值得关注。

原文

6月9日

12:18

Tw93@HiTw93

精选

Warp 终端发布更新，新增会话回滚功能，重新打开窗格可恢复最多 1500 行滚动内容，且 AI 输出时滚动或调整窗口大小不会跳回顶部。Codex 后端让助手直接使用现有 Codex 登录，无需额外 API 密钥。AI 聊天支持实时流式回答、/suggest 建议下一条消息，并可靠地重新打开。AI Shell 的 # 快速修复增加了注入检测，并阻止访问 .env 和 SSH 密钥等凭证文件。SmartPrompt 在无代理或编辑器运行时支持 Cmd+Q 快速退出，Smart Tab 默认先接受灰色自动建议。

AI产品 Warp 终端会话回滚 AI 聊天安全

推荐理由：Warp 这次更新解决了终端用户最头疼的会话丢失和 AI 输出跳转问题，做开发运维的团队可以直接升级体验，建议点开看看完整更新列表。

原文

11:08

arXiv cs.LG@Gilad Gressel, Rahul Pankajakshan, Julia Diament, Efim Hudis, Krishnashree Achuthan, Yisroel Mirsky

精选

随着LLM被部署为智能体，可靠监控需要知道不仅输出内容，还有哪些指令在引导其行为。当模型推断意外子目标、遵循上下文线索或受提示注入和隐藏目标影响时，这变得困难。现有激活到语言方法无法恢复智能体场景中同时活跃的完整指令集、约束、禁止和子目标。PRISM是一个激活条件解释器，从冻结目标模型的隐藏状态解码出忠实的活动指令要点列表。它使用法官引导的GRPO训练，奖励覆盖的指令并惩罚无支持的指令，在良性、约束、提示注入和隐藏目标设置中优于基线方法，尤其在安全相关目标上表现突出。

论文指令恢复激活解释智能体监控安全 LLM

推荐理由：PRISM解决了LLM智能体监控中指令恢复的盲区，对安全团队和AI治理开发者来说，这是直接可用的工具，建议关注其在实际部署中的效果。

原文

02:12

LangChain@LangChainAI

精选

LangChain 提出每个智能体都需要一台“计算机”，关键在于如何安全地提供。他们推出了 LangSmith Sandboxes，作为解决方案，旨在为 AI 智能体提供隔离、可控的执行环境。这解决了智能体在运行代码或访问资源时的安全风险问题，让开发者能更放心地部署自主代理。该功能目前已在 LangSmith 平台上线，值得关注。

AI产品智能体安全 LangChain LangSmith 沙箱

推荐理由：LangChain 解决了智能体安全执行的核心痛点，做自主代理开发的团队可以直接用 Sandboxes 隔离风险，建议点开看看具体实现。

原文

6月8日

23:46

23:46IT之家（博客/媒体）

彭博社记者古尔曼透露，苹果WWDC26除了AI、Siri和系统性能改进外，隐私和安全功能将是另外两大重点。本次WWDC主题演讲可能是库克最后一次以CEO身份参加。苹果预计将发布iOS/iPadOS/macOS 27系统及Apple智能、Siri等更新。

行业苹果 WWDC26 隐私安全库克

推荐理由：苹果用户和开发者值得关注——隐私和安全是苹果生态的核心竞争力，WWDC26的这两项更新可能直接影响你的设备使用体验和数据保护方式。

原文

6月7日

18:00

Decoder@Matthias Bastian

精选

OpenAI 为 ChatGPT 推出了新的 Lockdown Mode（锁定模式），该模式会禁用网页访问、Deep Research 和 Agent Mode 等功能，旨在阻止通过提示注入攻击窃取敏感数据。该模式并不能完全防止提示注入攻击，它只阻断了数据外泄链条的最后一步。提示注入仍然是一个未解决的问题。该功能主要面向需要处理敏感信息的企业用户，提供额外的安全层。

AI产品 ChatGPT 安全提示注入企业功能 OpenAI

推荐理由：企业团队终于有了一个实用的安全选项——Lockdown Mode 通过切断数据外泄路径来降低提示注入风险，处理机密信息的 ChatGPT 用户值得开启。

原文

6月6日

09:13

09:13Simon Willison’s Weblog（博客/媒体）

精选

OpenAI 正式上线 Lockdown Mode（锁定模式），该功能旨在通过限制出站网络请求来阻止提示注入攻击中的数据窃取。它不阻止提示注入本身，但能切断攻击者利用模型窃取敏感数据的通道。Lockdown Mode 面向免费、Go、Plus、Pro 及自助 ChatGPT Business 账户逐步开放。这一机制直接针对“致命三要素”中的数据外泄环节，且不依赖 AI 评估，因此更可靠。但这也意味着默认 ChatGPT 设置下，数据外泄防护并不充分。

AI产品安全提示注入 OpenAI ChatGPT 数据保护

推荐理由：提示注入是 LLM 应用的头号安全威胁，Lockdown Mode 用确定性机制切断了数据外泄路径，做 AI 安全或部署 ChatGPT 的团队值得关注并启用。

原文

6月3日

10:51

Weaviate@weaviate_io

精选

Weaviate 指出，RAG Agent 在生产环境中的成败不取决于模型，而取决于系统设计的四个基础层：安全、检索、指令和护栏。许多团队止步于演示阶段，但实际部署中会出现幻觉、输出不一致、安全漏洞等问题。可靠的 Agent 需要在这些层面进行严格设计，才能从演示变成真正可信的系统。文章提供了免费技术指南，涵盖高级 RAG 技术、工作流架构和安全实践。

AI产品 RAG Agent 系统设计安全生产部署

推荐理由：做 RAG 应用的团队别再只盯着模型了——这篇把生产环境踩坑的四个关键层讲透了，建议做 Agent 架构的开发者点开看看，能省不少试错成本。

原文

08:18

08:18Simon Willison’s Weblog（博客/媒体）

精选

Simon Willison 发布了 datasette-agent-micropython 0.1a0，旨在让 Datasette Agent 安全地生成并执行 Python 代码。该版本使用 MicroPython 在 WebAssembly 沙箱中运行代码，目前 GPT-5.5 生成的代码尚未突破沙箱限制。这个 alpha 版本看起来很有前景，为 AI 驱动的代码执行提供了更安全的隔离方案。

AI产品沙箱 Python datasette WebAssembly 安全

推荐理由：Datasette 用户和 AI 安全研究者值得关注——这个沙箱方案解决了 AI 生成代码的安全执行痛点，GPT-5.5 都未能逃逸，做数据分析和 AI Agent 的可以试试。

原文

00:51

LangChain@LangChainAI

LangChain 宣布 Fleet 提供最安全的计算机使用体验，允许智能体访问私有资源而无需担心泄露秘密。通过 Fleet 的访问配置文件，在沙箱中运行的智能体可以使用敏感凭证，而无需将凭证设置在沙箱内部。请求会被拦截，秘密会被注入，智能体可以调用受保护的服务而无需看到秘密本身。这一方案解决了智能体访问敏感系统时的安全痛点，适合需要让 AI 代理操作私有数据的团队。

AI产品智能体安全凭证管理沙箱 Fleet

推荐理由：Fleet 解决了智能体访问敏感系统时的核心安全矛盾——既要授权又要保密，做 AI 代理安全部署的团队可以直接用这个方案，省去自己设计凭证注入的麻烦。

原文

00:28

The Rundown AI@therundownai

今日 AI 领域多则要闻：Nvidia 正在将智能体技术贯穿其全栈产品线，推动 AI 从模型到应用的端到端智能化。美国参议员 Bernie Sanders 提出新法案，旨在建立公共 AI 基础设施，确保公众利益。此外，有报道称黑客通过询问 Meta AI 成功获取 Instagram 账户，引发安全担忧。还有将 Claude 会话转化为技能的日常审计方法，以及 4 款新 AI 工具和社区工作流发布。

行业智能体 Nvidia 公共AI 安全 AI工具

推荐理由：Nvidia 全栈智能体布局影响所有 AI 开发者，值得关注其生态变化；Bernie Sanders 法案可能重塑 AI 监管格局，关注公共 AI 的团队建议点开。

原文

6月2日

10:05

Harrison Chase@hwchase17

精选

LangChain 宣布 LangSmith Sandboxes 正式可用，这是一个让智能体安全编写和执行代码的沙箱环境。该沙箱与运行时隔离，支持网络控制、持久化状态，并在出错时提供快照/恢复功能。LangChain 创始人认为未来所有智能体都需要具备写代码和执行代码的能力。开发者可在 20 分钟内学会如何安全运行智能体代码。

AI产品智能体沙箱 LangSmith 代码执行安全

推荐理由：智能体安全执行代码是构建可靠 AI 系统的关键，做智能体开发的团队可以直接用这个沙箱来隔离风险，建议试试。

原文

09:55

LangChain@LangChainAI

精选

LangChain 的 MukilLoganathan 在 Interrupt 大会上发表了关于沙箱（Sandboxes）的主题演讲。演讲在 20 分钟内展示了如何安全运行智能体代码，包括与运行时隔离、网络控制、持久化状态，以及在出错时进行快照和恢复。这对于需要部署 AI 智能体的开发者来说，是保障安全性和可靠性的关键实践。视频已在 YouTube 上线，值得相关从业者观看。

AI产品 LangChain 智能体沙箱安全部署

推荐理由：LangChain 官方教你如何安全运行智能体代码，做 AI 智能体部署的开发者可以直接看视频学习，20 分钟掌握沙箱隔离、网络控制和快照恢复等关键技巧。

原文

6月1日

10:41

arXiv cs.AI@Maksuda Bilkis Baby, Khushika Shah, Naiyue Liang, Lei Zhang

精选

针对公开代码仓库中凭据泄露检测高误报率问题，研究者提出一个三类分类框架，将占位符/弱凭据作为独立类别，结合CodeBERT语义理解与字符级模式识别。在包含10种编程语言的9426个样本数据集上，模型在真实凭据泄露检测上达到93%召回率和89%精确率，同时将高严重性告警减少33%。相比纯字符级方法，占位符/弱凭据检测F1从54%提升至81%，且跨语言泛化能力强，9/10语言在留一语言评估中F1超过0.80。

论文凭据泄露检测 CodeBERT CNN 安全开源仓库

推荐理由：安全团队终于有了能区分真实凭据和占位符的检测工具，误报率大幅降低。做DevSecOps的开发者可以直接参考这个框架来优化自己的凭据扫描流程。

原文

5月31日

10:00

10:00Simon Willison’s Weblog（博客/媒体）

精选72°

Anthropic 发布了一篇详细的技术文章，介绍了如何在 Claude.ai、Claude Code 和 Claude Cowork 三个产品中实现沙箱隔离。文章解释了不同产品使用的沙箱技术：Claude.ai 使用 gVisor，Claude Code 在本地运行并使用 macOS 的 Seatbelt 和 Linux 的 Bubblewrap，而 Claude Cowork 则运行完整的虚拟机。文章还披露了一些之前未公开的安全风险，例如通过 api.anthropic.com/v1/files 进行数据泄露的漏洞。这篇文档填补了行业在沙箱产品文档化方面的空白，让用户能更清楚地评估其安全性。

AI产品沙箱/隔离安全 Claude Claude Code Anthropic

推荐理由：Anthropic 首次公开了 Claude 系列产品的沙箱实现细节，做 AI 安全或部署 LLM 应用的团队可以据此评估信任边界，建议直接阅读原文了解具体漏洞案例。

原文

5月30日

01:01

01:01OpenAI Blog（博客/媒体）

OpenAI 发布了一份关于第三方AI评估的指南，旨在帮助评估者系统性地评估前沿模型的能力、安全防护和有效性。该指南强调了评估的透明性、可重复性和独立性，为第三方评估提供了标准化框架。这对于确保AI系统在部署前得到充分测试、减少潜在风险具有重要意义。指南涵盖了评估设计、执行和报告的关键步骤，是推动AI治理和信任建设的重要一步。

行业 AI评估安全治理 OpenAI 第三方评估

推荐理由：做AI安全评估、模型审计或合规工作的团队可以直接参考这份标准化框架，省去自己摸索评估流程的时间。

原文

00:38

LangChain@LangChainAI

LangSmith 推出了 LLM Gateway 功能，允许用户在请求到达模型之前强制执行支出限制并自动脱敏个人身份信息（PII）。这一功能在请求处理的前端进行控制，而非事后补救，能有效防止预算超支和数据泄露。对于使用大型语言模型的团队来说，这提供了更安全、更可控的调用方式。该功能目前已在 LangSmith 平台上可用。

AI产品 LangSmith LLM Gateway 预算控制 PII脱敏安全

推荐理由：做 LLM 应用开发的团队终于有了预算和隐私的防线——在请求到达模型前就拦截超支和敏感数据泄露，比事后审计靠谱得多，建议直接集成到生产流程。

原文

5月28日

11:13

阿里云 Alibaba Cloud@alibaba_cloud

阿里云发布AI Agent安全解决方案，指出当前有超过4万个AI Agent实例暴露在风险中，供应链安全问题日益严峻。传统安全措施已不足以应对Agent时代的威胁。该方案提出了7项最佳实践，旨在保护数字员工的安全。对于依赖AI Agent的企业和开发者来说，这是必须关注的安全升级。

AI产品 AI Agent 安全阿里云供应链风险最佳实践

推荐理由：AI Agent的安全漏洞正在成为企业的新软肋，4万+实例暴露的数据触目惊心。做Agent部署的团队建议直接参考这7项实践，能帮你避开供应链攻击的坑。

原文

03:08

@OpenAIDevs@OpenAIDevs

OpenAI 宣布扩展 Admin API，新增功能包括支出警报、模型白名单、数据保留控制、托管工具控制，以及文件搜索和网页搜索等功能的更细粒度成本可见性。这些更新使企业能够以编程方式管理 OpenAI 项目，提升安全性和成本控制能力。对于使用 OpenAI 的企业团队，这意味着可以更精细地管理 API 使用权限和预算，减少人工干预。

AI产品 OpenAI Admin API 企业管理成本控制安全

推荐理由：企业团队终于可以编程管理 OpenAI 项目了——支出警报和模型白名单直接解决权限和成本失控的痛点，做企业级 AI 集成的开发者建议立即查看。

原文

5月27日

11:28

11:28Simon Willison’s Weblog（博客/媒体）

curl 项目维护者 Daniel Stenberg 透露，由于 AI 辅助生成的安全报告激增，项目正面临前所未有的压力。2026 年安全报告提交速度是 2024 年的 4-5 倍，平均每天超过一份，且报告质量极高、细节详尽。维护团队的工作量已严重失衡，甚至影响到家庭生活。好消息是，这些报告发现的漏洞多为低危或中危，自 2023 年 10 月以来未出现高危漏洞。

行业 curl 安全 AI辅助安全开源维护 Daniel Stenberg

推荐理由：开源维护者被 AI 安全报告淹没的现状值得所有依赖 curl 的团队关注——这暴露了 AI 辅助安全研究的双刃剑效应，做开源维护或安全研究的人看完会有感触。

原文

5月26日

08:41

08:41IT之家（博客/媒体）

88°

Anthropic 的最强模型 Claude Mythos 预览版在 Claude Code 和 Claude Security 中短暂出现后被撤下，暗示即将公开上线。该模型定位为面向计算机安全任务的前沿模型，相比 Opus 4.7 在代码推理和自主执行方面显著提升。Anthropic 此前警告 Mythos 能自动开发专业级网络攻击手段，因此迟迟未全面开放。同时，Anthropic 推进名为 Glasswing 的项目，联合其他公司保护关键软件系统，已使用 Mythos Preview 帮助 50 家组织。这一动态表明 Anthropic 在平衡模型能力与安全风险后，可能准备向更广泛用户开放。

AI模型 Anthropic Claude Mythos 推理模型代码推理安全

推荐理由：Anthropic 最强模型 Mythos 即将公开，做安全研究和代码自动化的开发者值得关注——它既能大幅提升效率，也带来新的安全挑战，建议提前了解其能力边界。

原文

5月23日

10:57

10:57IT之家（博客/媒体）

83°

Anthropic 在 Project Glasswing 项目上线一个月后，宣布其 Claude Mythos Preview 模型已与约 50 家合作伙伴合作，在关键软件中发现超过 1 万个高危和关键漏洞。该模型将部分团队的漏洞发现速度提升超过 10 倍，当前瓶颈已从发现转向验证和修补。Cloudflare 在关键系统中发现 2000 个漏洞，误报率优于人工；Mozilla 在 Firefox 150 中修复 271 个漏洞，是之前的 10 倍。外部评测中，Mythos Preview 成为首个端到端攻破两个网络攻防靶场的模型。针对开源软件，已扫描 1000 多个项目，发现 23019 个漏洞，其中 1587 个经人工复核确认为真实漏洞，真实率达 90.6%。

AI产品漏洞挖掘 Claude Mythos Preview 安全开源 Anthropic

推荐理由：安全团队和开源维护者终于有了靠谱的 AI 漏洞挖掘工具——Claude Mythos 将发现速度提升 10 倍，但修补环节成为新瓶颈，做安全运营或维护开源项目的建议点开看看实际数据。

原文

5月22日

08:05

08:05Simon Willison’s Weblog（博客/媒体）

精选

Simon Willison 发布了 datasette-agent-sprites 0.1a0，这是一个 Datasette Agent 插件，允许用户在 Fly Sprites 沙箱中安全地运行命令。该插件利用 Fly Sprites 的隔离环境来执行代码，从而避免对主机系统造成风险。这对于需要在 Datasette 中执行用户提供的或不可信代码的场景特别有用，例如数据分析或自动化任务。通过沙箱化，插件增强了 Datasette 的安全性，同时保持了灵活性和易用性。

AI产品沙箱 Datasette Fly 插件安全

推荐理由：如果你在用 Datasette 做数据分析或自动化，这个插件让你安全地执行不可信代码，建议试试 Fly Sprites 沙箱的隔离能力。

原文

01:10

NVIDIA AI@NVIDIAAI

76°

NVIDIA 发布了 NVIDIA-Verified Agent Skills，旨在解决 AI 智能体技能引入的安全漏洞问题。这些经过验证的技能提供透明信息，包括技能功能、来源、风险以及是否被修改。每个技能都附带技能卡，并基于 agentskills.io 开放规范构建，确保在 Claude Code、OpenAI Codex 和 Cursor 等平台上可靠运行。此举提升了智能体生态的安全性和互操作性。

AI产品智能体安全 NVIDIA 技能验证互操作性

推荐理由：AI 智能体开发者终于有了安全可追溯的技能来源——NVIDIA 的 Verified Skills 解决了技能引入的漏洞风险，做智能体应用或使用 Claude Code、Codex 的团队可以直接集成，减少安全审查成本。

原文

5月21日

11:15

arXiv cs.AI@Mohamed Almukhtar, Anwar Ghammam, Hua Ming

精选

一项针对 AI 代理生成的 Python 重构 Pull Request 的实证研究发现，平均 22.5% 的变更提升了代码质量属性，其中可用性提升最频繁（36.5%）。但 24.17% 的修改文件引入了新的 Pylint 问题（主要是约定违规如长行），4.7% 引入了新的 Bandit 安全发现。尽管存在这些问题，73.5% 的 PR 被合并，包括那些引入新问题但同时也移除了旧问题的案例。研究还归纳了 24 种常见变更操作及其与 lint/安全发现的关系，强调了在 AI 驱动开发中加强质量与安全门控的必要性。

论文 AI 编程代码质量安全重构 Python

推荐理由：AI 写代码到底靠不靠谱？这篇论文用数据说话——重构 PR 质量有提升也有隐患，做 AI 编程工具或代码审查的团队值得看看，能帮你设计更好的质量门控。

原文

07:59

Claude@claudeai

精选

Claude AI 推出 MCP tunnels 功能，允许智能体在不暴露于公网的情况下，安全访问私有网络内的 MCP 服务器。该功能解决了企业级 AI 应用中数据安全和网络隔离的关键痛点，无需开放公网端口即可实现内部服务的调用。开发者可以直接在私有网络内部署 MCP 服务器，并通过隧道机制与智能体通信，降低安全风险。

AI产品 MCP/工具智能体安全 Claude 私有网络

推荐理由：企业 AI 开发者终于有了安全访问内部服务的方案——MCP tunnels 解决了私有网络暴露的痛点，做企业级智能体集成的团队可以直接用。

原文

07:59

07:59Simon Willison’s Weblog（博客/媒体）

72°

Google I/O 上发布了 Gemini Spark，定位为个人 AI 智能体，可原生连接 Gmail、Calendar、Drive 等 Google 应用。Spark 运行在 Gemini 3.5 Flash 和 Antigravity 上，后者是一个包含桌面应用、CLI 工具、SDK 和 IDE 的生态系统。Google 强调 Spark 采用企业级安全措施，包括隔离的临时 VM 和 DLP 策略，但 prompt injection 风险仍是隐忧。同时，开源 Gemini CLI 将于 6 月 18 日停止支持，被闭源的 Antigravity CLI 取代。

AI产品 Gemini Google I/O 智能体安全 Antigravity

推荐理由：Google 正式推出个人 AI 智能体 Gemini Spark，直接对标 OpenClaw，做自动化工作流的开发者值得关注其安全架构和 Antigravity 生态。

原文

5月20日

18:06

Geek@geekbb

精选

攻击者通过篡改VS Code扩展商店中的恶意扩展，感染了使用VS Code的GitHub开发者设备。1月14日，GitHub检测到并隔离了受感染的端点，移除了恶意扩展版本。攻击者声称获取了约3800个内部仓库，与GitHub初步调查结果一致。GitHub正在分析扩展的源代码以评估影响。

行业 GitHub VS Code 安全恶意扩展供应链攻击

推荐理由：开发者的安全警钟：从VS Code扩展到GitHub仓库

原文

17:53

阿里云 Alibaba Cloud@alibaba_cloud

阿里云将于2026年5月22日举办ClawTalks第4期线上活动，主题为AI Agent全生命周期安全。活动将揭示针对AI Agent的真实威胁案例，分享阿里云验证的7项安全最佳实践，并演示Agent Security Center如何实时发现、映射和保护AI资产。随着AI Agent部署规模扩大，安全与创新的平衡成为企业关注焦点。

行业 AI Agent 安全阿里云企业AI 最佳实践

推荐理由：AI Agent规模化部署的安全问题日益紧迫，阿里云这次分享的7项最佳实践和实时安全中心演示，对正在或计划部署Agent的企业团队很有参考价值，建议设置提醒参与。

原文