08:16Harrison Chase@hwchase17LangSmith 推出 Harbor 功能,用于在沙箱环境中运行评估(evals)。Harbor 支持需要隔离的评估任务。自托管沙箱即将上线。该功能回应了用户对 LangSmith 沙箱自托管的询问。AI产品LangSmithHarbor沙箱评估推荐理由:想跑沙箱评估?LangSmith 的 Harbor 帮你搞定,还能自托管。原文
00:50LangChain@LangChainAI精选LangChain指出,AI代理执行沙箱需满足两个关键要求:启动速度接近无服务器函数(避免代理等待2分钟VM启动),以及具备完整机器状态(支持安装依赖、编辑文件和断点续传)。代理本质上是会话中的工作进程,而非无状态请求处理器。技巧LangChain沙箱智能体无服务器函数推荐理由:LangChain讲清楚了代理沙箱的设计关键——既要快得像无服务器函数,又要能像全功能机器一样保存状态。做AI代理的人该看看。原文
08:14Simon Willison’s Weblog(博客/媒体)Datasette 团队发布新插件 datasette-apps,允许在 iframe 沙箱中运行自包含 HTML+JavaScript 应用。应用可通过 JavaScript 执行只读 SQL 查询,也可使用预存查询执行写操作。沙箱限制访问 cookies/localStorage 并注入 CSP 头,防止外发 HTTP 请求。该模式灵感来源于 Claude Artifacts 和作者此前构建的 HTML 工具集合。演示实例托管在 agent.datasette.io 上,需 GitHub 登录。AI产品Datasettedatasette-apps沙箱SQLite开源工具推荐理由:Simon Willison 把 Claude Artifacts 的思路搬到了 Datasette 里,让你能在沙箱里跑自定义 HTML 应用,还能直接查 SQLite 数据库,写个内部工具特别方便。原文
07:34Claude Code: GitHub Releases@ashwin-ant精选Anthropic 发布 Claude Code v2.1.181,新增 /config key=value 语法,可在交互式、-p 和远程控制模式下直接设置任意设置(如 /config thinking=false)。新增 sandbox.allowAppleEvents 选项,允许沙箱命令在 macOS 上发送 Apple Events。新增 CLAUDE_CLIENT_PRESENCE_FILE 环境变量,指向标记文件后可抑制移动推送通知。升级内置 Bun 运行时到 1.4,改进长段落流式输出为逐行显示,API 连接掉线自动重试。修复了多个 bug,包括提示缓存、网络驱动器上的文件写入、macOS 认证流程等。AI产品Claude CodeAnthropic编程助手沙箱MCP10 个信源在谈推荐理由:Anthropic 给 Claude Code 打了补丁,新增了直接改配置的命令、苹果事件权限,还修了一堆烦人 bug,特别是网络慢时的卡死问题,用着更顺了。原文
00:49Philipp Schmid@_philschmid72°Phil Schmid 发布了一篇交互式博客,深入解析 Gemini Managed Agents 的内部工作原理。该代理通过一次 API 调用即可启动一个隔离沙箱,在其中进行推理、调用工具、执行代码并读取输出,直至任务完成。博客包含一个可点击的实时模拟器,展示了执行循环、沙箱内部运作以及 API 与沙箱之间的通信过程。AI产品Gemini智能体沙箱API交互式博客推荐理由:想理解 Gemini 代理如何自动完成复杂任务的开发者,这篇博客用交互式模拟器把执行循环讲透了,建议点开动手试试。原文
23:49LangChain@LangChainAILangSmith Sandboxes 现已正式发布(GA),这是一个专为智能体代码执行设计的安全、可扩展环境。它与 Deep Agents SDK 和 LangSmith 平台深度集成,为开发者提供隔离的代码运行沙箱。该功能解决了智能体执行代码时的安全性和资源管理问题,适合构建和测试复杂智能体应用的团队。AI产品智能体LangSmith沙箱代码执行安全推荐理由:做智能体开发的团队终于有了官方集成的安全沙箱——LangSmith Sandboxes 解决了代码执行的安全和扩展痛点,用 LangChain 的可以直接集成使用。原文
02:12LangChain@LangChainAI精选LangChain 提出每个智能体都需要一台“计算机”,关键在于如何安全地提供。他们推出了 LangSmith Sandboxes,作为解决方案,旨在为 AI 智能体提供隔离、可控的执行环境。这解决了智能体在运行代码或访问资源时的安全风险问题,让开发者能更放心地部署自主代理。该功能目前已在 LangSmith 平台上线,值得关注。AI产品智能体安全LangChainLangSmith沙箱推荐理由:LangChain 解决了智能体安全执行的核心痛点,做自主代理开发的团队可以直接用 Sandboxes 隔离风险,建议点开看看具体实现。原文
12:30Simon Willison’s Weblog(博客/媒体)精选Simon Willison 发布了 micropython-wasm 实验性包,将 MicroPython 编译为 WebAssembly,实现在 Python 应用内安全运行用户代码。该沙箱支持内存和 CPU 限制、文件与网络访问控制、以及宿主函数交互,解决了 Datasette 等插件系统长期存在的安全风险。目前作为 alpha 版本发布,并已用于 Datasette Agent 的代码执行沙箱插件。开发者可直接通过 pip 安装使用,无需额外步骤。AI产品沙箱WebAssemblyMicroPython插件安全Datasette推荐理由:插件开发者终于有了一个轻量级沙箱方案——用 MicroPython + WASM 隔离用户代码,做 Datasette、LLM 等 Python 工具扩展的团队可以直接集成,避免插件拖垮主应用或泄露数据。原文
21:50LangChain@LangChainAILangSmith Sandboxes 正式发布 GA 版本,新增 Sandbox CLI 工具。该 CLI 支持从 Dockerfile 构建快照、管理沙箱、打开交互式控制台、隧道原始 TCP,以及使用 ssh、scp、rsync、sftp 等标准工具像操作 Linux 机器一样操作沙箱。这为开发者提供了更灵活、更强大的隔离测试环境,简化了 AI 应用的调试与部署流程。AI产品LangSmith沙箱CLIDocker测试工具推荐理由:做 AI 应用开发和测试的团队终于有了一个像 Linux 机器一样可操作的沙箱 CLI,从 Dockerfile 构建快照到标准工具全支持,建议直接试试。原文
08:48Simon Willison’s Weblog(博客/媒体)micropython-wasm 0.1a1 版本发布,主要修复了作者在构建 datasette-agent-micropython 时遇到的一些限制。该项目将 MicroPython 编译为 WebAssembly,可在浏览器或 Node.js 中运行 Python 代码,适用于沙箱化执行场景。新版本解决了此前版本中的兼容性问题,提升了在 WebAssembly 环境下的可用性。对于需要在 Web 端安全运行 Python 脚本的开发者来说,这是一个实用的工具。AI产品PythonWebAssembly沙箱micropython-wasm开源/仓库推荐理由:如果你需要在浏览器或 Node.js 中安全运行 Python 代码,micropython-wasm 提供了一个轻量沙箱方案,这次更新修复了关键限制,做 Web 端 Python 沙箱的开发者值得关注。原文
08:38LangChain@LangChainAI精选LangSmith Sandboxes 正式发布 GA 版本,新增快照和低成本分支功能。用户可以捕获运行中的沙箱状态,并以接近单个沙箱的成本创建最多 10 个并行分支。当智能体走向错误路径时,可快速恢复快照并尝试不同分支,大幅提升调试和实验效率。该功能旨在帮助开发者更灵活地管理 AI 智能体的开发与测试流程。AI产品LangSmith沙箱快照分支智能体调试推荐理由:做 AI 智能体开发和测试的团队,终于可以低成本并行实验不同路径了——快照恢复功能让试错成本降到最低,建议直接上手体验。原文
08:18Simon Willison’s Weblog(博客/媒体)精选Simon Willison 发布了 datasette-agent-micropython 0.1a0,旨在让 Datasette Agent 安全地生成并执行 Python 代码。该版本使用 MicroPython 在 WebAssembly 沙箱中运行代码,目前 GPT-5.5 生成的代码尚未突破沙箱限制。这个 alpha 版本看起来很有前景,为 AI 驱动的代码执行提供了更安全的隔离方案。AI产品沙箱PythondatasetteWebAssembly安全推荐理由:Datasette 用户和 AI 安全研究者值得关注——这个沙箱方案解决了 AI 生成代码的安全执行痛点,GPT-5.5 都未能逃逸,做数据分析和 AI Agent 的可以试试。原文
07:58GitHub@githubGitHub 宣布为 Copilot 引入云端和本地沙箱功能,旨在为日益增多的 Agent 工作流提供更强的代码安全、隔离和控制保障。企业团队可以通过这些沙箱安全地实验 Agent 工作流,并集中管理安全策略。此举回应了 AI 编程助手在自动化任务中可能带来的安全风险,让开发者能在受控环境中放心使用 Agent。该功能尤其适合需要严格合规的企业开发团队。AI产品GitHub CopilotAgent 工作流沙箱企业安全编程助手推荐理由:GitHub 终于给 Copilot 的 Agent 模式上了安全锁,做企业级开发的团队可以直接用沙箱隔离实验,不用再担心 Agent 乱改代码。原文
00:51LangChain@LangChainAILangChain 宣布 Fleet 提供最安全的计算机使用体验,允许智能体访问私有资源而无需担心泄露秘密。通过 Fleet 的访问配置文件,在沙箱中运行的智能体可以使用敏感凭证,而无需将凭证设置在沙箱内部。请求会被拦截,秘密会被注入,智能体可以调用受保护的服务而无需看到秘密本身。这一方案解决了智能体访问敏感系统时的安全痛点,适合需要让 AI 代理操作私有数据的团队。AI产品智能体安全凭证管理沙箱Fleet推荐理由:Fleet 解决了智能体访问敏感系统时的核心安全矛盾——既要授权又要保密,做 AI 代理安全部署的团队可以直接用这个方案,省去自己设计凭证注入的麻烦。原文
10:05Harrison Chase@hwchase17精选LangChain 宣布 LangSmith Sandboxes 正式可用,这是一个让智能体安全编写和执行代码的沙箱环境。该沙箱与运行时隔离,支持网络控制、持久化状态,并在出错时提供快照/恢复功能。LangChain 创始人认为未来所有智能体都需要具备写代码和执行代码的能力。开发者可在 20 分钟内学会如何安全运行智能体代码。AI产品智能体沙箱LangSmith代码执行安全推荐理由:智能体安全执行代码是构建可靠 AI 系统的关键,做智能体开发的团队可以直接用这个沙箱来隔离风险,建议试试。原文
09:55LangChain@LangChainAI精选LangChain 的 MukilLoganathan 在 Interrupt 大会上发表了关于沙箱(Sandboxes)的主题演讲。演讲在 20 分钟内展示了如何安全运行智能体代码,包括与运行时隔离、网络控制、持久化状态,以及在出错时进行快照和恢复。这对于需要部署 AI 智能体的开发者来说,是保障安全性和可靠性的关键实践。视频已在 YouTube 上线,值得相关从业者观看。AI产品LangChain智能体沙箱安全部署推荐理由:LangChain 官方教你如何安全运行智能体代码,做 AI 智能体部署的开发者可以直接看视频学习,20 分钟掌握沙箱隔离、网络控制和快照恢复等关键技巧。原文
23:20Philipp Schmid@_philschmid精选Google 在 Gemini API 中推出了 Managed Agents 功能,旨在简化 AI 智能体的构建。开发者只需一次 API 调用,即可创建一个能在托管 Linux 沙箱中推理、编写和运行代码、管理文件的智能体。该服务将循环和环境管理移至平台端,让开发者专注于产品构建而非基础设施。团队表示将快速迭代并欢迎反馈。AI产品智能体Gemini API托管服务沙箱API推荐理由:做 AI 智能体开发的团队终于可以省去环境搭建的麻烦——单次 API 调用就能跑起一个完整智能体,建议直接试试。原文
11:15Anthropic: Engineering(资讯)精选72°Anthropic 在博客中详细介绍了他们如何为 Claude 的不同产品(claude.ai、Claude Code、Cowork)设计安全边界,以控制智能体能力增长带来的潜在风险。文章从工程角度探讨了“爆炸半径”的概念,即智能体可能造成最大损害的范围,并分享了通过权限隔离、沙箱执行、行为监控等机制来限制这一半径的实践经验。这些方法旨在确保 Claude 在变得更强大时,仍能安全地服务于用户,避免意外或恶意使用导致的严重后果。对于关注 AI 安全与可靠性的开发者和团队,这篇文章提供了实用的工程思路。AI产品ClaudeAI 安全智能体沙箱权限控制10 个信源在谈推荐理由:Anthropic 把智能体安全从概念落地到了工程实践,做 AI 产品安全架构的团队可以直接借鉴他们的权限隔离和沙箱方案,看完会对“如何安全地变强”有更具体的认知。原文
22:44Philipp Schmid@_philschmidGoogle 发布了 Gemini Managed Agents 开发指南,允许开发者通过一次 API 调用即可获得 Gemini 3.5 Flash 模型、反重力工具集和远程 Linux 沙箱环境,无需自行管理基础设施或编排流程。该指南涵盖了快速启动(代码/文件/浏览)、持久多轮对话与流式输出、自定义代理(通过 AGENTS.md 和挂载配置)以及运维功能(快照、白名单、出口凭证)。这大幅降低了构建和部署 AI 代理的门槛,尤其适合需要快速原型验证或生产级代理的团队。AI产品GeminiManaged AgentsAI 代理沙箱开发指南推荐理由:做 AI 代理开发的团队终于可以省去基础设施和编排的麻烦——一次 API 调用就能拿到模型+沙箱+工具,建议直接看指南里的快速启动部分。原文
23:05Philipp Schmid@_philschmid精选83°Google I/O 上,Phil Schmid 展示了 Gemini Managed Agents 的新 Interactions API,允许开发者通过一次 API 调用为 AI 提供一个安全托管的 Linux 沙箱环境。这个沙箱让 AI 可以执行代码、管理自己的内存,相当于拥有了一个独立的“电脑”。这大大简化了构建复杂智能体的流程,降低了开发门槛。对于需要让 AI 自主操作环境的场景,这是一个重要的基础设施更新。AI产品智能体GeminiAPI沙箱Google I/O推荐理由:做智能体开发的团队终于可以省去自己搭建沙箱的麻烦——一次 API 调用就能给 AI 一个安全 Linux 环境,建议直接看演示。原文
11:04arXiv cs.AI@Yunpeng Dong, Jingkai He, Yuze Hou, Dong Du, Zhonghu Xu, Si Yu, Yubin Xia, Haibo Chen精选72°DeltaBox 提出了一种新的操作系统级抽象 DeltaState,用于实现 AI 智能体沙箱的毫秒级检查点与回滚。其核心洞察是:智能体运行中连续检查点高度相似,因此只需复制变化部分而非整个状态。DeltaBox 包含两个协同设计的机制:DeltaFS 通过分层文件系统实现基于变化的文件状态 C/R,DeltaCR 通过增量转储和模板进程 fork 加速进程状态回滚。实验表明,DeltaBox 的检查点和回滚延迟分别仅为 14ms 和 5ms,相比传统全量复制方法大幅降低,使得智能体在固定时间预算内能探索更多节点。该工作对需要高频状态探索的 AI 智能体(如测试时树搜索、强化学习)有重要价值。论文智能体沙箱检查点/回滚操作系统DeltaBox推荐理由:做 AI 智能体高频状态探索(如树搜索、强化学习)的团队,终于有了能跑在毫秒级的沙箱 C/R 方案,不用再被几百毫秒的延迟卡脖子,建议直接看论文实现。原文
08:05Simon Willison’s Weblog(博客/媒体)精选Simon Willison 发布了 datasette-agent-sprites 0.1a0,这是一个 Datasette Agent 插件,允许用户在 Fly Sprites 沙箱中安全地运行命令。该插件利用 Fly Sprites 的隔离环境来执行代码,从而避免对主机系统造成风险。这对于需要在 Datasette 中执行用户提供的或不可信代码的场景特别有用,例如数据分析或自动化任务。通过沙箱化,插件增强了 Datasette 的安全性,同时保持了灵活性和易用性。AI产品沙箱DatasetteFly插件安全推荐理由:如果你在用 Datasette 做数据分析或自动化,这个插件让你安全地执行不可信代码,建议试试 Fly Sprites 沙箱的隔离能力。原文
08:05LangChain@LangChainAI精选LangChain 发布了 Context Hub,这是一个集中管理 AI 应用上下文(包括 Prompt、Memory 技能和子智能体定义)的工具,所有内容都支持版本控制。同时,它还提供了沙箱环境,每个线程有独立的持久化文件系统,支持安全代码执行、Shell 访问和文件 I/O,并带有认证代理和快照功能。这解决了多智能体系统中上下文碎片化和版本混乱的问题,让开发者能更高效地构建和调试复杂 AI 工作流。AI产品LangChainContext Hub智能体沙箱版本控制推荐理由:做多智能体或复杂 AI 应用的团队终于有了上下文管理利器——版本化 Prompt 和 Memory 技能,配合安全沙箱,调试和迭代效率会明显提升,建议直接体验。原文
08:05Latent.Space@latentspacepod精选72°Daytona 发布专为 AI 智能体设计的计算平台,提供 60 毫秒启动的沙箱环境,能在 75 秒内创建 5 万个独立实例,日均运行 85 万次。该平台从人类开发环境转向智能体沙箱,支持裸金属、有状态快照,并针对强化学习(RL)和评估(evals)工作负载优化。Daytona 认为 Kubernetes 在智能体规模下失效,AI 云应更像 Stripe 而非 AWS。CEO Ivan Burazin 解释了为何智能体需要可组合计算机,以及 RL 工作负载占比从 0% 增长到约 50% 的趋势。AI产品智能体计算平台沙箱强化学习Daytona推荐理由:Daytona 解决了智能体大规模并发运行时的基础设施瓶颈,做 AI 智能体开发、RL 训练或大规模评估的团队可以直接用这个平台替代传统云方案,值得关注。原文
16:57阿里云 Alibaba Cloud@alibaba_cloud精选阿里巴巴云发布了 AgentScope Java 1.1 版本,主要新增工作区驱动的持久化、可插拔文件系统、自动上下文管理以及安全沙箱编排功能。这些特性旨在支持可扩展的企业级智能体应用,提升开发效率和运行稳定性。该版本对 Java 生态下的 AI 智能体开发具有重要意义,尤其适合需要高可靠性和安全性的企业场景。AI产品智能体JavaAgentScope企业级沙箱推荐理由:企业级 Java 智能体开发终于有了更成熟的持久化和沙箱方案,做企业 AI 应用的团队可以直接升级试试。原文
07:18NVIDIA AI@NVIDIAAIOpenShell 发布 v0.0.41 版本,新增智能体驱动的策略管理功能,允许用户通过 shell 直接控制策略和资源。CLI 中增加了沙箱资源标志,支持自定义 CA 用于 OIDC TLS 验证,并改进了沙箱下载的工作区边界检查。该版本还包含多项错误修复和稳定性改进,旨在提升开发者在安全策略和资源管理方面的效率。AI产品智能体策略管理沙箱CLI安全推荐理由:对于需要精细控制沙箱资源和策略的开发者,OpenShell 这次更新直接把管理权交到了 shell 里,省去繁琐配置,值得一试。原文
07:26Perplexity@perplexity_aiPerplexity AI 宣布其计算机默认安全,每个任务都在独立的硬件隔离沙箱中运行,并采用 VPC 级别的存储和计算分离。代理通过短期代理令牌进行身份验证,而非原始 API 密钥。这一设计旨在提升 AI 代理执行任务时的安全性和隔离性,防止数据泄露和权限滥用。对于需要运行敏感任务的开发者或企业用户,这提供了一种更安全的执行环境。AI产品安全沙箱Perplexity AI代理VPC推荐理由:Perplexity 的硬件隔离沙箱解决了 AI 代理执行任务时的安全痛点,做自动化或敏感数据处理的团队可以直接用,建议点开了解具体实现。原文
21:36Simon Willison’s Weblog(博客/媒体)Simon Willison 发布了一个实验,展示如何在 CSP 保护的沙箱 iframe 中加载应用,并通过自定义 fetch() 拦截 CSP 错误,将错误信息传递给父窗口。父窗口可以提示用户将出错的域名添加到允许列表,然后刷新页面。该实验使用 GPT-5.5 xhigh 在 Codex 桌面应用中构建。这一方法解决了 CSP 严格策略下第三方资源加载的灵活性问题,为安全与可用性平衡提供了新思路。论文内容安全策略iframe安全沙箱允许列表推荐理由:做安全或前端开发的团队会感兴趣——这个实验让 CSP 允许列表动态化,既保持安全又减少用户被拦在门外的挫败感,值得点开看实现细节。原文
21:35Anthropic: Engineering(资讯)精选Anthropic 发布 Claude Code 的安全升级,引入沙箱执行环境和细粒度权限控制,使 AI 编程助手在自主执行代码时更安全。新系统允许用户为不同操作设置权限级别(如允许、拒绝、询问),并支持在隔离环境中运行高风险命令。这解决了 AI 编程工具在自动化过程中可能误操作或泄露敏感数据的问题。开发者可以更放心地让 Claude Code 自主完成复杂任务,同时保持对关键操作的控制。AI产品Claude Code安全沙箱权限控制编程助手10 个信源在谈推荐理由:AI 编程助手的安全性是团队上生产的关键门槛,Anthropic 这次用沙箱和权限分层解决了自主执行的风险痛点,用 Claude Code 做自动化开发的团队值得仔细看。原文