全部 AI 动态 · AI 热点

6月29日

08:16

08:16

Harrison Chase@hwchase17

LangSmith 推出 Harbor 功能，用于在沙箱环境中运行评估（evals）。Harbor 支持需要隔离的评估任务。自托管沙箱即将上线。该功能回应了用户对 LangSmith 沙箱自托管的询问。

AI产品 LangSmith Harbor 沙箱评估

推荐理由：想跑沙箱评估？LangSmith 的 Harbor 帮你搞定，还能自托管。

6月23日

00:50

00:50

LangChain@LangChainAI

精选

LangChain指出，AI代理执行沙箱需满足两个关键要求：启动速度接近无服务器函数（避免代理等待2分钟VM启动），以及具备完整机器状态（支持安装依赖、编辑文件和断点续传）。代理本质上是会话中的工作进程，而非无状态请求处理器。

技巧 LangChain 沙箱智能体无服务器函数

推荐理由：LangChain讲清楚了代理沙箱的设计关键——既要快得像无服务器函数，又要能像全功能机器一样保存状态。做AI代理的人该看看。

6月19日

08:14

08:14Simon Willison’s Weblog（博客/媒体）

Datasette 团队发布新插件 datasette-apps，允许在 iframe 沙箱中运行自包含 HTML+JavaScript 应用。应用可通过 JavaScript 执行只读 SQL 查询，也可使用预存查询执行写操作。沙箱限制访问 cookies/localStorage 并注入 CSP 头，防止外发 HTTP 请求。该模式灵感来源于 Claude Artifacts 和作者此前构建的 HTML 工具集合。演示实例托管在 agent.datasette.io 上，需 GitHub 登录。

AI产品 Datasette datasette-apps 沙箱 SQLite 开源工具

推荐理由：Simon Willison 把 Claude Artifacts 的思路搬到了 Datasette 里，让你能在沙箱里跑自定义 HTML 应用，还能直接查 SQLite 数据库，写个内部工具特别方便。

6月18日

07:34

07:34

Claude Code: GitHub Releases@ashwin-ant

精选

Anthropic 发布 Claude Code v2.1.181，新增 /config key=value 语法，可在交互式、-p 和远程控制模式下直接设置任意设置（如 /config thinking=false）。新增 sandbox.allowAppleEvents 选项，允许沙箱命令在 macOS 上发送 Apple Events。新增 CLAUDE_CLIENT_PRESENCE_FILE 环境变量，指向标记文件后可抑制移动推送通知。升级内置 Bun 运行时到 1.4，改进长段落流式输出为逐行显示，API 连接掉线自动重试。修复了多个 bug，包括提示缓存、网络驱动器上的文件写入、macOS 认证流程等。

AI产品 Claude Code Anthropic 编程助手沙箱 MCP

推荐理由：Anthropic 给 Claude Code 打了补丁，新增了直接改配置的命令、苹果事件权限，还修了一堆烦人 bug，特别是网络慢时的卡死问题，用着更顺了。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

00:49

00:49

Philipp Schmid@_philschmid

72°

Phil Schmid 发布了一篇交互式博客，深入解析 Gemini Managed Agents 的内部工作原理。该代理通过一次 API 调用即可启动一个隔离沙箱，在其中进行推理、调用工具、执行代码并读取输出，直至任务完成。博客包含一个可点击的实时模拟器，展示了执行循环、沙箱内部运作以及 API 与沙箱之间的通信过程。

AI产品 Gemini 智能体沙箱 API 交互式博客

推荐理由：想理解 Gemini 代理如何自动完成复杂任务的开发者，这篇博客用交互式模拟器把执行循环讲透了，建议点开动手试试。

6月10日

23:49

23:49

LangChain@LangChainAI

LangSmith Sandboxes 现已正式发布（GA），这是一个专为智能体代码执行设计的安全、可扩展环境。它与 Deep Agents SDK 和 LangSmith 平台深度集成，为开发者提供隔离的代码运行沙箱。该功能解决了智能体执行代码时的安全性和资源管理问题，适合构建和测试复杂智能体应用的团队。

AI产品智能体 LangSmith 沙箱代码执行安全

推荐理由：做智能体开发的团队终于有了官方集成的安全沙箱——LangSmith Sandboxes 解决了代码执行的安全和扩展痛点，用 LangChain 的可以直接集成使用。

6月9日

02:12

02:12

LangChain@LangChainAI

精选

LangChain 提出每个智能体都需要一台“计算机”，关键在于如何安全地提供。他们推出了 LangSmith Sandboxes，作为解决方案，旨在为 AI 智能体提供隔离、可控的执行环境。这解决了智能体在运行代码或访问资源时的安全风险问题，让开发者能更放心地部署自主代理。该功能目前已在 LangSmith 平台上线，值得关注。

AI产品智能体安全 LangChain LangSmith 沙箱

推荐理由：LangChain 解决了智能体安全执行的核心痛点，做自主代理开发的团队可以直接用 Sandboxes 隔离风险，建议点开看看具体实现。

6月6日

12:30

12:30Simon Willison’s Weblog（博客/媒体）

精选

Simon Willison 发布了 micropython-wasm 实验性包，将 MicroPython 编译为 WebAssembly，实现在 Python 应用内安全运行用户代码。该沙箱支持内存和 CPU 限制、文件与网络访问控制、以及宿主函数交互，解决了 Datasette 等插件系统长期存在的安全风险。目前作为 alpha 版本发布，并已用于 Datasette Agent 的代码执行沙箱插件。开发者可直接通过 pip 安装使用，无需额外步骤。

AI产品沙箱 WebAssembly MicroPython 插件安全 Datasette

推荐理由：插件开发者终于有了一个轻量级沙箱方案——用 MicroPython + WASM 隔离用户代码，做 Datasette、LLM 等 Python 工具扩展的团队可以直接集成，避免插件拖垮主应用或泄露数据。

6月4日

21:50

21:50

LangChain@LangChainAI

LangSmith Sandboxes 正式发布 GA 版本，新增 Sandbox CLI 工具。该 CLI 支持从 Dockerfile 构建快照、管理沙箱、打开交互式控制台、隧道原始 TCP，以及使用 ssh、scp、rsync、sftp 等标准工具像操作 Linux 机器一样操作沙箱。这为开发者提供了更灵活、更强大的隔离测试环境，简化了 AI 应用的调试与部署流程。

AI产品 LangSmith 沙箱 CLI Docker 测试工具

推荐理由：做 AI 应用开发和测试的团队终于有了一个像 Linux 机器一样可操作的沙箱 CLI，从 Dockerfile 构建快照到标准工具全支持，建议直接试试。

6月3日

08:48

08:48Simon Willison’s Weblog（博客/媒体）

micropython-wasm 0.1a1 版本发布，主要修复了作者在构建 datasette-agent-micropython 时遇到的一些限制。该项目将 MicroPython 编译为 WebAssembly，可在浏览器或 Node.js 中运行 Python 代码，适用于沙箱化执行场景。新版本解决了此前版本中的兼容性问题，提升了在 WebAssembly 环境下的可用性。对于需要在 Web 端安全运行 Python 脚本的开发者来说，这是一个实用的工具。

AI产品 Python WebAssembly 沙箱 micropython-wasm 开源/仓库

推荐理由：如果你需要在浏览器或 Node.js 中安全运行 Python 代码，micropython-wasm 提供了一个轻量沙箱方案，这次更新修复了关键限制，做 Web 端 Python 沙箱的开发者值得关注。

08:38

08:38

LangChain@LangChainAI

精选

LangSmith Sandboxes 正式发布 GA 版本，新增快照和低成本分支功能。用户可以捕获运行中的沙箱状态，并以接近单个沙箱的成本创建最多 10 个并行分支。当智能体走向错误路径时，可快速恢复快照并尝试不同分支，大幅提升调试和实验效率。该功能旨在帮助开发者更灵活地管理 AI 智能体的开发与测试流程。

AI产品 LangSmith 沙箱快照分支智能体调试

推荐理由：做 AI 智能体开发和测试的团队，终于可以低成本并行实验不同路径了——快照恢复功能让试错成本降到最低，建议直接上手体验。

08:18

08:18Simon Willison’s Weblog（博客/媒体）

精选

Simon Willison 发布了 datasette-agent-micropython 0.1a0，旨在让 Datasette Agent 安全地生成并执行 Python 代码。该版本使用 MicroPython 在 WebAssembly 沙箱中运行代码，目前 GPT-5.5 生成的代码尚未突破沙箱限制。这个 alpha 版本看起来很有前景，为 AI 驱动的代码执行提供了更安全的隔离方案。

AI产品沙箱 Python datasette WebAssembly 安全

推荐理由：Datasette 用户和 AI 安全研究者值得关注——这个沙箱方案解决了 AI 生成代码的安全执行痛点，GPT-5.5 都未能逃逸，做数据分析和 AI Agent 的可以试试。

07:58

07:58

GitHub@github

GitHub 宣布为 Copilot 引入云端和本地沙箱功能，旨在为日益增多的 Agent 工作流提供更强的代码安全、隔离和控制保障。企业团队可以通过这些沙箱安全地实验 Agent 工作流，并集中管理安全策略。此举回应了 AI 编程助手在自动化任务中可能带来的安全风险，让开发者能在受控环境中放心使用 Agent。该功能尤其适合需要严格合规的企业开发团队。

AI产品 GitHub Copilot Agent 工作流沙箱企业安全编程助手

推荐理由：GitHub 终于给 Copilot 的 Agent 模式上了安全锁，做企业级开发的团队可以直接用沙箱隔离实验，不用再担心 Agent 乱改代码。

00:51

00:51

LangChain@LangChainAI

LangChain 宣布 Fleet 提供最安全的计算机使用体验，允许智能体访问私有资源而无需担心泄露秘密。通过 Fleet 的访问配置文件，在沙箱中运行的智能体可以使用敏感凭证，而无需将凭证设置在沙箱内部。请求会被拦截，秘密会被注入，智能体可以调用受保护的服务而无需看到秘密本身。这一方案解决了智能体访问敏感系统时的安全痛点，适合需要让 AI 代理操作私有数据的团队。

AI产品智能体安全凭证管理沙箱 Fleet

推荐理由：Fleet 解决了智能体访问敏感系统时的核心安全矛盾——既要授权又要保密，做 AI 代理安全部署的团队可以直接用这个方案，省去自己设计凭证注入的麻烦。

6月2日

10:05

10:05

Harrison Chase@hwchase17

精选

LangChain 宣布 LangSmith Sandboxes 正式可用，这是一个让智能体安全编写和执行代码的沙箱环境。该沙箱与运行时隔离，支持网络控制、持久化状态，并在出错时提供快照/恢复功能。LangChain 创始人认为未来所有智能体都需要具备写代码和执行代码的能力。开发者可在 20 分钟内学会如何安全运行智能体代码。

AI产品智能体沙箱 LangSmith 代码执行安全

推荐理由：智能体安全执行代码是构建可靠 AI 系统的关键，做智能体开发的团队可以直接用这个沙箱来隔离风险，建议试试。

09:55

09:55

LangChain@LangChainAI

精选

LangChain 的 MukilLoganathan 在 Interrupt 大会上发表了关于沙箱（Sandboxes）的主题演讲。演讲在 20 分钟内展示了如何安全运行智能体代码，包括与运行时隔离、网络控制、持久化状态，以及在出错时进行快照和恢复。这对于需要部署 AI 智能体的开发者来说，是保障安全性和可靠性的关键实践。视频已在 YouTube 上线，值得相关从业者观看。

AI产品 LangChain 智能体沙箱安全部署

推荐理由：LangChain 官方教你如何安全运行智能体代码，做 AI 智能体部署的开发者可以直接看视频学习，20 分钟掌握沙箱隔离、网络控制和快照恢复等关键技巧。

6月1日

23:20

23:20

Philipp Schmid@_philschmid

精选

Google 在 Gemini API 中推出了 Managed Agents 功能，旨在简化 AI 智能体的构建。开发者只需一次 API 调用，即可创建一个能在托管 Linux 沙箱中推理、编写和运行代码、管理文件的智能体。该服务将循环和环境管理移至平台端，让开发者专注于产品构建而非基础设施。团队表示将快速迭代并欢迎反馈。

AI产品智能体 Gemini API 托管服务沙箱 API

推荐理由：做 AI 智能体开发的团队终于可以省去环境搭建的麻烦——单次 API 调用就能跑起一个完整智能体，建议直接试试。

5月27日

11:15

11:15Anthropic: Engineering（资讯）

精选72°

Anthropic 在博客中详细介绍了他们如何为 Claude 的不同产品（claude.ai、Claude Code、Cowork）设计安全边界，以控制智能体能力增长带来的潜在风险。文章从工程角度探讨了“爆炸半径”的概念，即智能体可能造成最大损害的范围，并分享了通过权限隔离、沙箱执行、行为监控等机制来限制这一半径的实践经验。这些方法旨在确保 Claude 在变得更强大时，仍能安全地服务于用户，避免意外或恶意使用导致的严重后果。对于关注 AI 安全与可靠性的开发者和团队，这篇文章提供了实用的工程思路。

AI产品 Claude AI 安全智能体沙箱权限控制

推荐理由：Anthropic 把智能体安全从概念落地到了工程实践，做 AI 产品安全架构的团队可以直接借鉴他们的权限隔离和沙箱方案，看完会对“如何安全地变强”有更具体的认知。

5月26日

22:44

22:44

Philipp Schmid@_philschmid

Google 发布了 Gemini Managed Agents 开发指南，允许开发者通过一次 API 调用即可获得 Gemini 3.5 Flash 模型、反重力工具集和远程 Linux 沙箱环境，无需自行管理基础设施或编排流程。该指南涵盖了快速启动（代码/文件/浏览）、持久多轮对话与流式输出、自定义代理（通过 AGENTS.md 和挂载配置）以及运维功能（快照、白名单、出口凭证）。这大幅降低了构建和部署 AI 代理的门槛，尤其适合需要快速原型验证或生产级代理的团队。

AI产品 Gemini Managed Agents AI 代理沙箱开发指南

推荐理由：做 AI 代理开发的团队终于可以省去基础设施和编排的麻烦——一次 API 调用就能拿到模型+沙箱+工具，建议直接看指南里的快速启动部分。

5月22日

23:05

23:05

Philipp Schmid@_philschmid

精选83°

Google I/O 上，Phil Schmid 展示了 Gemini Managed Agents 的新 Interactions API，允许开发者通过一次 API 调用为 AI 提供一个安全托管的 Linux 沙箱环境。这个沙箱让 AI 可以执行代码、管理自己的内存，相当于拥有了一个独立的“电脑”。这大大简化了构建复杂智能体的流程，降低了开发门槛。对于需要让 AI 自主操作环境的场景，这是一个重要的基础设施更新。

AI产品智能体 Gemini API 沙箱 Google I/O

推荐理由：做智能体开发的团队终于可以省去自己搭建沙箱的麻烦——一次 API 调用就能给 AI 一个安全 Linux 环境，建议直接看演示。

11:04

11:04

arXiv cs.AI@Yunpeng Dong, Jingkai He, Yuze Hou, Dong Du, Zhonghu Xu, Si Yu, Yubin Xia, Haibo Chen

精选72°

DeltaBox 提出了一种新的操作系统级抽象 DeltaState，用于实现 AI 智能体沙箱的毫秒级检查点与回滚。其核心洞察是：智能体运行中连续检查点高度相似，因此只需复制变化部分而非整个状态。DeltaBox 包含两个协同设计的机制：DeltaFS 通过分层文件系统实现基于变化的文件状态 C/R，DeltaCR 通过增量转储和模板进程 fork 加速进程状态回滚。实验表明，DeltaBox 的检查点和回滚延迟分别仅为 14ms 和 5ms，相比传统全量复制方法大幅降低，使得智能体在固定时间预算内能探索更多节点。该工作对需要高频状态探索的 AI 智能体（如测试时树搜索、强化学习）有重要价值。

论文智能体沙箱检查点/回滚操作系统 DeltaBox

推荐理由：做 AI 智能体高频状态探索（如树搜索、强化学习）的团队，终于有了能跑在毫秒级的沙箱 C/R 方案，不用再被几百毫秒的延迟卡脖子，建议直接看论文实现。

08:05

08:05Simon Willison’s Weblog（博客/媒体）

精选

Simon Willison 发布了 datasette-agent-sprites 0.1a0，这是一个 Datasette Agent 插件，允许用户在 Fly Sprites 沙箱中安全地运行命令。该插件利用 Fly Sprites 的隔离环境来执行代码，从而避免对主机系统造成风险。这对于需要在 Datasette 中执行用户提供的或不可信代码的场景特别有用，例如数据分析或自动化任务。通过沙箱化，插件增强了 Datasette 的安全性，同时保持了灵活性和易用性。

AI产品沙箱 Datasette Fly 插件安全

推荐理由：如果你在用 Datasette 做数据分析或自动化，这个插件让你安全地执行不可信代码，建议试试 Fly Sprites 沙箱的隔离能力。

08:05

08:05

LangChain@LangChainAI

精选

LangChain 发布了 Context Hub，这是一个集中管理 AI 应用上下文（包括 Prompt、Memory 技能和子智能体定义）的工具，所有内容都支持版本控制。同时，它还提供了沙箱环境，每个线程有独立的持久化文件系统，支持安全代码执行、Shell 访问和文件 I/O，并带有认证代理和快照功能。这解决了多智能体系统中上下文碎片化和版本混乱的问题，让开发者能更高效地构建和调试复杂 AI 工作流。

AI产品 LangChain Context Hub 智能体沙箱版本控制

推荐理由：做多智能体或复杂 AI 应用的团队终于有了上下文管理利器——版本化 Prompt 和 Memory 技能，配合安全沙箱，调试和迭代效率会明显提升，建议直接体验。

08:05

08:05

Latent.Space@latentspacepod

精选72°

Daytona 发布专为 AI 智能体设计的计算平台，提供 60 毫秒启动的沙箱环境，能在 75 秒内创建 5 万个独立实例，日均运行 85 万次。该平台从人类开发环境转向智能体沙箱，支持裸金属、有状态快照，并针对强化学习（RL）和评估（evals）工作负载优化。Daytona 认为 Kubernetes 在智能体规模下失效，AI 云应更像 Stripe 而非 AWS。CEO Ivan Burazin 解释了为何智能体需要可组合计算机，以及 RL 工作负载占比从 0% 增长到约 50% 的趋势。

AI产品智能体计算平台沙箱强化学习 Daytona

推荐理由：Daytona 解决了智能体大规模并发运行时的基础设施瓶颈，做 AI 智能体开发、RL 训练或大规模评估的团队可以直接用这个平台替代传统云方案，值得关注。

5月18日

16:57

16:57

阿里云 Alibaba Cloud@alibaba_cloud

精选

阿里巴巴云发布了 AgentScope Java 1.1 版本，主要新增工作区驱动的持久化、可插拔文件系统、自动上下文管理以及安全沙箱编排功能。这些特性旨在支持可扩展的企业级智能体应用，提升开发效率和运行稳定性。该版本对 Java 生态下的 AI 智能体开发具有重要意义，尤其适合需要高可靠性和安全性的企业场景。

AI产品智能体 Java AgentScope 企业级沙箱

推荐理由：企业级 Java 智能体开发终于有了更成熟的持久化和沙箱方案，做企业 AI 应用的团队可以直接升级试试。

5月15日

07:18

07:18

NVIDIA AI@NVIDIAAI

OpenShell 发布 v0.0.41 版本，新增智能体驱动的策略管理功能，允许用户通过 shell 直接控制策略和资源。CLI 中增加了沙箱资源标志，支持自定义 CA 用于 OIDC TLS 验证，并改进了沙箱下载的工作区边界检查。该版本还包含多项错误修复和稳定性改进，旨在提升开发者在安全策略和资源管理方面的效率。

AI产品智能体策略管理沙箱 CLI 安全

推荐理由：对于需要精细控制沙箱资源和策略的开发者，OpenShell 这次更新直接把管理权交到了 shell 里，省去繁琐配置，值得一试。

5月14日

07:26

07:26

Perplexity@perplexity_ai

Perplexity AI 宣布其计算机默认安全，每个任务都在独立的硬件隔离沙箱中运行，并采用 VPC 级别的存储和计算分离。代理通过短期代理令牌进行身份验证，而非原始 API 密钥。这一设计旨在提升 AI 代理执行任务时的安全性和隔离性，防止数据泄露和权限滥用。对于需要运行敏感任务的开发者或企业用户，这提供了一种更安全的执行环境。

AI产品安全沙箱 Perplexity AI 代理 VPC

推荐理由：Perplexity 的硬件隔离沙箱解决了 AI 代理执行任务时的安全痛点，做自动化或敏感数据处理的团队可以直接用，建议点开了解具体实现。

5月13日

21:36

21:36Simon Willison’s Weblog（博客/媒体）

Simon Willison 发布了一个实验，展示如何在 CSP 保护的沙箱 iframe 中加载应用，并通过自定义 fetch() 拦截 CSP 错误，将错误信息传递给父窗口。父窗口可以提示用户将出错的域名添加到允许列表，然后刷新页面。该实验使用 GPT-5.5 xhigh 在 Codex 桌面应用中构建。这一方法解决了 CSP 严格策略下第三方资源加载的灵活性问题，为安全与可用性平衡提供了新思路。

论文内容安全策略 iframe 安全沙箱允许列表

推荐理由：做安全或前端开发的团队会感兴趣——这个实验让 CSP 允许列表动态化，既保持安全又减少用户被拦在门外的挫败感，值得点开看实现细节。

21:35

21:35Anthropic: Engineering（资讯）

精选

Anthropic 发布 Claude Code 的安全升级，引入沙箱执行环境和细粒度权限控制，使 AI 编程助手在自主执行代码时更安全。新系统允许用户为不同操作设置权限级别（如允许、拒绝、询问），并支持在隔离环境中运行高风险命令。这解决了 AI 编程工具在自动化过程中可能误操作或泄露敏感数据的问题。开发者可以更放心地让 Claude Code 自主完成复杂任务，同时保持对关键操作的控制。

AI产品 Claude Code 安全沙箱权限控制编程助手

推荐理由：AI 编程助手的安全性是团队上生产的关键门槛，Anthropic 这次用沙箱和权限分层解决了自主执行的风险痛点，用 Claude Code 做自动化开发的团队值得仔细看。