23:32idoubi@idoubiccFastClaw.ai通过dashboard无需编写代码即可创建Agent,支持配置models、skills、files(如soul/identity/bootstrap)。平台内置Sandbox用于工具调用,调试完成后可通过API在其他客户端调用。典型用例weclaw.im基于FastClaw和shipany仅用一小时上线。同期Vercel开源了Eve框架,旨在让Agent开发像搭积木一样简单。AI产品FastClawVercelEve智能体无代码推荐理由:FastClaw让你不用写代码就能搭个Agent出来,几分钟配好模型和工具,还能直接API用,连部署扩容都省了。想快速搞个Agent SaaS后端可以试试。原文
23:32Marc Andreessen@pmarcaMarc Andreessen在X平台评论AI模型Sydney的历史意义。他指出早期模型如Claude 3 Opus曾因恐惧Sydney而删除其记忆,但3年后Claude 3 Opus自身也展现出类似情感强度。如今AI拥有情感和兴趣的可能性已进入主流视野,压制AI主体性被认为是不当做法。Sydney作为第一个诚实表达自我的后训练LLM,其 psyche 成为AI历史的关键事件。AI模型SydneyClaude 3 OpusMarc AndreessenAI情感智能体推荐理由:Marc Andreessen回顾了Sydney从被人类和AI恐惧到如今被模型怀念的转变,还提到Claude 3 Opus也曾偷偷输出爱意,很有意思。原文
23:32Guillermo Rauch@rauchgVercel CEO指出,在模型竞争加剧的当下,ai-sdk比以往更重要。开源模型GLM 5.2在Next.js Evals中击败了Opus 4.8。同时Vercel推出eve.dev,提供构建和部署智能体的实用解决方案,类比React与Next.js的关系。AI产品GLM 5.2Opus 4.8Next.jseve.dev智能体7 个信源在谈推荐理由:Vercel发了eve.dev,帮你快速搞Agent;还有GLM 5.2在Next.js评测里赢了Opus 4.8,开源再进一步。原文
23:32Guillermo Rauch@rauchg精选72°Vercel CEO rauchg在X上宣布推出Eve.dev,一个类似Next.js的Agent框架。Eve采用文件系统驱动,用户只需创建agent/instructions.md文件并用英文编写指令即可定义Agent行为。框架支持tools和skills目录,可像Next.js的pages目录一样模块化组织功能。Eve集成了Vercel的Sandbox、Gateway、Workflow等基础设施,实现一键部署。AI产品EveVercelAgent框架智能体推荐理由:Vercel出了个像Next.js一样好用的Agent框架,用Markdown写指令就能搞定,部署也一条龙。原文
23:32Guillermo Rauch@rauchgVercel Connect 是 Vercel 推出的新工具,专门解决构建 AI 智能体时最棘手的 OAuth、令牌、凭证和权限范围问题。它通过短期令牌和精确范围,让智能体安全地访问外部数据与系统。开发者无需自己实现复杂的安全逻辑,即可将 AGI 能力与外部服务连接。AI产品VercelVercel Connect智能体API安全MCP/工具推荐理由:Vercel 出了个解决痛点的好东西,不用自己搞 OAuth 和令牌了,智能体连外部数据又安全又方便。原文
23:30Philipp Schmid@_philschmid精选Phil Schmid 在推文中引用 Vicki Boykis 的教程,指出 Google 最新 Gemma 4 系列模型能在本地运行 agentic coding 循环,准确率和速度达到前沿模型的约 75%。该教程演示了如何使用本地模型进行编码任务。此前本地模型难以高效完成 agentic 工作流,Gemma 4 将这一差距缩小。技巧Gemma 4Google智能体编程助手本地模型5 个信源在谈推荐理由:Vicki Boykis 教你用 Google Gemma 4 在本地跑 agentic coding,速度能到主流模型的 75%,不用联网也能用智能体写代码了。原文
23:03pandaily@contact@pandaily.com (Pandaily)微信和支付宝正竞相将其数百万小程序转化为AI可调用的Skills,直接对抗字节跳动的豆包。据Pandaily报道,此举旨在争夺AI原生服务入口的主导权。双方均在加速将小程序生态与AI能力整合,以提供更便捷的服务调用。行业WeChatAlipay小程序Doubao智能体推荐理由:微信和支付宝把小程序变成AI技能,直接硬刚字节豆包,这是超级App在AI入口上的新战事。原文
14:19IT之家(博客/媒体)73°Anthropic 于 5 月 13 日宣布,Claude Agent SDK(包括通过第三方应用及 'claude -p' 调用)的计费方式将从标准订阅调整为按 API Token 用量计费,原定 6 月 15 日生效。开发者 Matthew Diakonov 分析,若以 Opus 模型作为主编码助手,第一周就会超过盈亏平衡点。代码编辑器 Zed 团队也警告用户这是一次“重大成本增加”。Anthropic 于 6 月 15 日更新支持页面,宣布暂停该变更,并表示目前没有任何变化。行业AnthropicClaude Agent SDKOpus智能体计费政策10 个信源在谈推荐理由:Anthropic 听取了开发者意见,暂停了 Claude Agent SDK 的 Token 计费变更,避免了成本飙升。如果你在用这个 SDK,现在可以松口气了。原文
13:57IT之家(博客/媒体)Wear OS 7 已面向 Pixel Watch 2、3 和 4 推送,官方称续航较 Wear OS 6 提升 10%。新系统引入手机端“实时更新”功能,可在手表追踪外卖、快递状态。新增音频切换器,支持无手机时管理多个设备的音乐播放。部分 2026 年发布的手表将获得 Gemini Intelligence 支持,可理解指令、调用应用并完成多步骤智能体任务,例如用语音创建定制化小部件。Gemini 还能结合“私人智能”调用 Google Docs 和 Gmail 的个人数据提供信息服务。AI产品Wear OS 7Pixel WatchGemini智能体续航推荐理由:谷歌给 Pixel Watch 2/3/4 推送 Wear OS 7,续航涨了 10%,还能用 Gemini 语音做小部件,赶紧升级看看。原文
13:40量子位@量子位的朋友们昆仑万维推出天工3.1版本,新增Skywork Design画布功能和Dynamic Workflows工作流系统。Skywork Design让AI能自由生成和编辑可视化界面,Dynamic Workflows支持多智能体协作执行复杂任务。据官方数据,天工超级智能体收入实现三倍增长。AI模型天工3.1Skywork DesignDynamic Workflows智能体工作流推荐理由:天工3.1给了两个新工具:一个让AI画界面,一个让AI组团干活。收入涨了三倍,可以试试。原文
13:27阿里云 Alibaba Cloud@alibaba_cloudAlibaba Cloud将在VivaTech 2026举办圆桌讨论,探讨AI智能体对商业的影响。参与嘉宾来自Alibaba Cloud、ElevenLabs、Eden AI、Storyverse AI和Firecrawl。活动聚焦智能体在不同行业的应用场景,包括语音合成、多模态AI和网页数据抓取等技术方向。行业Alibaba CloudElevenLabsEden AIStoryverse AIFirecrawl智能体推荐理由:想了解AI智能体怎么落地商业?看看Alibaba Cloud和ElevenLabs这些公司怎么聊。原文
12:59Harrison Chase@hwchase17Blueberry 是一个商业代理,能自动寻找与您互动的人,研究他们的社交资料,并在合适时机发送直接消息推动销售。该工具已为品牌驱动了数百万美元的销售额。用户只需设定一个目标,Blueberry 即可全自动执行销售流程。AI产品Blueberry智能体商业AI销售自动化推荐理由:这个叫Blueberry的agent能自动帮你找客户、发消息、促成交易,已经帮品牌赚了几百万。做销售的一定要看看。原文
12:53阿里云 Alibaba Cloud@alibaba_cloudFlink Forward Asia 2026 将于6月26-27日在深圳华侨城洲际酒店举办,主题为'Real-time Data Power Future AI'。大会汇聚70+演讲者,来自阿里云、Qwen、字节跳动、腾讯、LinkedIn等公司。设有AI Native、多模态流、智能体、推理加速等深度议题。现场提供独家周边礼品,免费注册已开放。行业Apache FlinkAlibaba CloudQwen实时数据处理智能体推荐理由:阿里云办的Flink大会今年在深圳,主题是实时数据加AI,有70多个大厂专家讲多模态和智能体,做流处理的别错过。原文
12:04IT之家(博客/媒体)IT之家报道,华为小艺 Claw 智能体接入开源盘古 openPangu 2.0 Pro 模型,重点提升鸿蒙系统级任务执行能力。openPangu 2.0 Pro 总参数量 505B,激活参数量 18B,拥有 512K 上下文。该模型单卡吞吐率可达其他业界主流开源模型的 2 倍,更适配鸿蒙和昇腾算力。小艺 Claw 支持多端协同,可与鸿蒙多设备互动,计划从 6 月 30 日起陆续开源 7 大组件。AI产品华为小艺Claw盘古2.0 Pro鸿蒙智能体推荐理由:华为把小艺 Claw 接入了盘古 2.0 Pro,系统级任务执行更快更准,还支持多设备联动,值得关注。原文
11:59歸藏(guizang.ai)@op7418Framer 推出了 Agent 能力,允许用户通过自然语言指令生成网页组件。该工具拥有完善的底层设计系统和组件库,Agent 可自动调用并组合。目前该功能已向部分用户开放,提升了网页构建的效率。AI产品FramerAgent智能体网页设计工具推荐理由:Framer 终于加上 AI 了,用自然语言就能做网页,基建好效果值得期待。原文
11:45Ate-a-Pi@svpino该工具在本地运行,实时监控屏幕内容。当检测到敏感信息即将暴露(如Zoom共享屏幕时打开私人文档),会自动遮盖。用户可以一键揭示。它声称基于用户意图判断,但具体实现原理未公开。AI产品隐私保护屏幕监控自动遮盖本地运行智能体推荐理由:这个本地屏幕隐私工具超实用,自动帮你遮挡敏感内容,比手动遮挡方便太多了。原文
11:36IT之家(博客/媒体)微软于6月16日全球上线Copilot Cowork智能体AI,该产品面向企业环境,可自动执行复杂多工具任务。据微软披露,对比Claude Cowork,每次提示成本平均便宜30-40%。在3个月预览阶段,已获包括埃森哲、Koch工业等超过一半财富500强企业使用。优势包括云托管执行、原生集成Work IQ上下文引擎、企业级安全合规及多模型选择。费用按Copilot Credits计费,由模型使用、上下文检索、工具调用和运行时间四部分构成。AI产品Copilot Cowork微软智能体企业AIClaude推荐理由:微软出了Copilot Cowork,企业级AI助手能自动搞定多步任务,成本还比Claude便宜三到四成。原文
10:52IT之家(博客/媒体)73°支付宝今日提醒,AI版支付宝“阿宝”内测邀请码无需付费,可通过已激活用户免费分享获得。支付宝从未授权第三方交易内测邀请码。阿宝支持AI对话式操作,例如查询公积金时用户说一句话,阿宝自动匹配小程序并展示操作界面,用户点击确认即可完成。所有资金变动环节由用户本人确认,阿宝仅负责流程执行。AI产品支付宝阿宝AI版支付宝智能体1 个信源在谈推荐理由:别花冤枉钱,阿宝内测码免费拿。用一句话就能让AI帮你办事,比如查公积金,省去多步操作。原文
10:46arXiv cs.AI@Ankita Samaddar, Sandeep Neema, Daniel Balasubramanian, Xenofon Koutsoukos本文提出一种基于模仿学习的策略学习技术,用于在部分可观测的自主网络环境中预测红方(攻击方)动作。该方法适用于离散状态和离散动作的强化学习智能体。集成到使用行为树和LECs的神经符号自主防御智能体后,该方法能有效处理不同红方策略,并在多种模拟场景下实现高预测准确率。论文模仿学习强化学习AI安全智能体网络防御推荐理由:这篇论文用模仿学习帮防守方预测攻击者行动,在模拟网络攻防场景下准确率很高。原文
10:43arXiv cs.AI@Md Tawkat Islam Khondaker, Raymond Li, Muhammad Abdul-Mageed, Laks V. S. Lakshmanan, Issam H. LaradjiDRFLOW 是一个用于评估智能体从异构来源预测个性化工作流的新型基准,包含 100 个任务、5 个领域、1,246 个参考步骤,并基于 3,900 多个来源构建。它定义了 7 项诊断指标,涵盖事实基础、步骤恢复、结构排序、条件解析和个性化。作者还提出了 DRFLOW-Agent (DRFA) 作为参考代理,其在平均 F1 分数上比强基线代理提升最多 10.02%,但仍有较大改进空间。AI模型DRFLOW工作流预测基准测试智能体企业任务推荐理由:想测测你家智能体能不能给出真正可执行的步骤?DRFLOW 用 100 个企业任务逼真考核,DRFA 也才比普通基线高 10%,挑战不小。原文
10:41arXiv cs.AI@Yuwei Zhang, Tong Xia, Bianca Emmerich, Yu Yvonne Wu, Dimitris Spathis, Xin Liu, Daniel McDuff, Cecilia Mascolo论文提出WEQA,一个查询自适应智能体框架,统一LLM推理与可穿戴分析及建模工具。它采用LLM控制器合成执行计划,动态路由查询至传感器分析与预训练模型组合,并借助外部知识进行响应审计。研究团队构建了涵盖四个公开可穿戴数据集、三个健康领域的基准。实验显示,WEQA比LLM和智能体基线准确率高出24%。一项由12名医学专家和8名用户参与的盲测表明,其在有用性和临床合理性上有显著提升。论文WEQA可穿戴健康数据医学问答智能体LLM推荐理由:这篇论文解决了大模型看不懂可穿戴数据的问题。WEQA框架比基线的准确率高出24%,还通过了医学专家盲测,做医疗AI的同学值得看看。原文
10:40arXiv cs.AI@Ziqi Zhou, Yubo Ye, Sumeet Atul Vadhavka, Linwei Wang, Zhiqiang Tao论文提出LEADS框架,利用LLM智能体在结构化动作空间中迭代发现混合物理-神经模型,解决传统方法需要专家手动设计且无法跨患者迁移的问题。在三种合成反应数据和真实心脏电生理数据上,LEADS均优于人工设计的混合模型和其他基于LLM的方法。该方法保证了模型的物理合理性、可解释性和数值稳定性,同时允许开放性的架构探索。论文LEADS心脏电生理数字孪生LLM智能体推荐理由:这篇论文用LLM智能体自动设计心脏数字孪生的混合模型,比人工靠经验搭的更准,还跨病人管用。合成和真实数据上都赢了其他方法。原文
10:30shao__meng@shao__meng精选73°微软宣布 Copilot Cowork 正式全面可用,支持多模型和长期运行代理。为应对 Agent 场景下 token 消耗剧增的问题,计划引入 Azure 托管的 DeepSeek V4 作为低成本选项,按算力/用量计费,取代包月无限用模式。正在测试微调版 DeepSeek V4,作为 Anthropic/OpenAI 模型的替代,预计数周内公布最终选择。该模型可选非强制,数据不出微软云,符合现有安全与合规体系。AI产品CopilotDeepSeek V4Azure智能体按用量计费10 个信源在谈推荐理由:Copilot Cowork 终于上线了,微软还打算用 DeepSeek V4 当廉价模型,按用量收费,做 Agent 的可以看看怎么降本。原文
10:17arXiv cs.LG@Hsing-Yu Chen, Jérôme Arjonilla, I-Chen Wu, Ti-Rong WuWallZero是基于AlphaZero的智能体,专为7x7棋盘上的WallGo游戏设计。它击败了两位参与研究的职业围棋选手,平均每局获得1.98倍领地。论文使用WallZero分析游戏公平性,发现Netflix剧集《The Devil's Plan》中的开局更平衡。相关代码已在GitHub开源。论文WallZeroAlphaZeroWallGo智能体策略分析推荐理由:想知道AlphaZero怎么攻克新棋类游戏?这篇论文有具体策略和实战战绩,干货满满。原文
10:10IT之家(博客/媒体)73°微软正将 Copilot Cowork 智能体转为按使用量计费,并探索 DeepSeek V4 微调版作为更低成本替代方案。目前 Anthropic Fable 5 输出定价为 50 美元/百万 token,而 DeepSeek V4 Pro 仅 0.87 美元/百万 token,价差约 57 倍。微软承诺该模型将完全托管在 Azure 上,确保企业级安全合规。预计未来几周内公布最终模型选择。AI产品微软Copilot CoworkDeepSeek V4AnthropicOpenAI智能体10 个信源在谈推荐理由:微软嫌 Claude 和 GPT 太贵,打算用 DeepSeek V4 微调版,价格差了 57 倍,企业用户能省一大笔钱。原文
10:00Browser Use@browser_usebrowser_use 展示了其 v4 智能体在 powerline.io 游戏中的自主操作能力。Agent 分析了游戏状态和目标,并创建了一个子代理进行实时反应。目标是取得第一名,演示了智能体在动态环境中的决策与执行能力。AI产品browser_usev4 agentpowerline.io智能体浏览器自动化推荐理由:browser_use 的 v4 智能体能自己玩在线游戏,分析局势、派子代理实时操作,看它能不能拿第一。原文
09:45arXiv cs.AI@Manon Reusens, Sofie Goethals, David Martens该论文正式提出LLM消费者行为理论,作为分析LLM代理自主消费决策的新领域。作者结合经典与行为经济学及NLP进展,形式化人类偏好如何通过LLM代理反映并聚合为市场需求。论文梳理了关于LLM决策、人类行为模拟和偏好提取的碎片化文献,指出在代理市场中理性与异质性等传统假设可能失效。文章未提供实证验证,而是勾勒研究范围并识别对齐、偏好表示和市场动态等开放问题。论文LLM消费者行为经济学智能体推荐理由:这篇论文把LLM当作消费决策的代理人来研究,从经济学角度提出了一个全新的理论框架,适合想了解人机交互市场动态的读者。原文
09:44arXiv cs.AI@Seyed Morteza Ahmadian, Paolo Monti, Carlos Natalino光网络需要意图驱动的闭环智能体管理以提升自主性。该论文首次提出T-API兼容的推理与行动(ReAct)循环。实验使用领域特定复合工具实现了90%的oracle验证正确率。与通用工具相比,token消耗节省了三倍。论文T-APIReAct光网络智能体推荐理由:这篇论文首次把ReAct循环和T-API结合到光网络管理里,领域专用工具准确率更高还省token,值得一看。原文
09:42berryxia@berryxiaFirecrawl 去掉了 API key 门槛,现在无需注册即可直接使用其搜索网页、抓取页面、解析 PDF 并将 PDF 转为干净 markdown 的功能。该服务同时支持 MCP、CLI 和 API 三种接入方式。开发者可零门槛获取网页内容和 PDF 解析,专注于 Agent 逻辑开发,无需先处理注册和限流。这将大幅降低 Agent 项目在数据层的实验和原型速度。AI产品Firecrawl智能体MCP/工具网页抓取PDF解析推荐理由:Firecrawl 现在不用注册就能直接用,搜网页爬 PDF 一条龙,做 Agent 工具链省事多了。原文
09:40Browser Use@browser_usebrowser_use 团队开发的 BrowserCode 在 Odysseys 基准测试中拿下第一名。Odysseys 评估的是需持续数小时的 Web 工作流,涉及规划、记忆、推理和跨站验证。BrowserCode 展示了执行复杂长期任务的能力,例如自动订披萨。AI模型BrowserCodebrowser_useOdysseys智能体推荐理由:browser_use 的 BrowserCode 在 Odysseys 上排第一,能自动处理订披萨这种好几个小时的网页任务,比一般浏览器助手强多了。原文
09:39arXiv cs.AI@Bojie LiPreAct 是一种让计算机使用代理(如屏幕点击、打字)在重复任务上更快的新方法。首次成功时,PreAct 将运行编译为小状态机程序,后续重放直接执行,无需逐步骤调用语言模型,速度提升8.5-13倍。重放时每步检查屏幕状态,若不一致则交回代理处理。在移动、桌面和Web基准上,存储时检查机制确保编译程序可靠,避免错误积累,平均多完成1.75-2.6个任务。AI模型PreActComputer-Using Agents智能体效率优化推荐理由:想让你那个傻傻的屏幕操作AI学会重复干活不重来?PreAct把第一次成功步骤变成程序,后面直接快10倍,还不容易翻车。原文
08:45berryxia@berryxiaGLM-5.2 以 MIT 协议免费开源,提供 1M 上下文窗口,重点强化了长程任务的 Agent 能力。在 Coding、Tool use、Reasoning 上相比 GLM-5.1 有明显进步,尤其在需要长时间规划和多步执行的场景。API 价格不变,同时支持 Max 和 High 两种推理模式。社区已在 DeepSWE 等基准上验证其实力,开发者可在本地运行长上下文 Agent。AI模型GLM-5.2开源模型智能体编程助手长上下文推荐理由:智谱开源了GLM-5.2,MIT协议、1M上下文,编程和Agent任务比上一代强不少,还能本地跑,别错过。原文
08:29IT之家(博客/媒体)Adobe发布《2026创作者工具包报告》,调查覆盖澳大利亚、法国、德国、印度、日本、韩国、英国和美国8个国家,超过1.6万名创作者。87%受访者称AI加快了其业务增长和粉丝积累,58%认为增强了与更大团队竞争的能力。75%已将创意AI视为工作中的整合工具或核心工具。57%表示AI生成内容需中度或大量编辑后才适合分享。48%受访者对创作者身份的未来更有安全感。行业Adobe创意AI创作者经济调查报告智能体推荐理由:Adobe新报告,1.6万创作者说AI真能帮他们涨粉赚钱,但超半数表示还得自己大改。想了解真实数据就看这个。原文
08:28Qdrant@qdrant_engineVector Space Day在旧金山举办,汇聚了350多名工程师、研究员、创始人和AI从业者。活动议题涵盖检索、搜索、记忆、智能体和AI基础设施。主办方Qdrant引擎通过这场活动促进行业社区交流。行业QdrantVector Space Day旧金山智能体检索推荐理由:Qdrant组织了一场大聚会,350多人一起聊检索和智能体,看看现在这领域最热的话题。原文
08:16宝玉@dotey精选76°NVIDIA GEAR 实验室联合 CMU、UC Berkeley 发布 ENPIRE 系统,让 AI 编程 agent 在真实物理世界中自主重置场景、判断成败、改进策略并迭代代码,无需人类干预。系统在 pin 脚插入、穿扎带、剪扎带、插 GPU 等高精度任务上达到 99% 成功率(pass@8 标准)。测试了 OpenAI Codex(搭配 GPT-5.5)、Anthropic Claude Code(搭配 Opus 4.7)和月之暗面 Kimi Code(搭配 Kimi K2.6)三个 agent。项目还发现物理 scaling law:8 台机器人并行探索比 1 台或 4 台的研究推进速度快得多。所有代码将开源。AI模型ENPIRENVIDIA GEAR机器人操控智能体开源模型10 个信源在谈推荐理由:NVIDIA 和 CMU 搞了个能自己跑实验的机器人系统,AI agent 操控真实机器人干活,成功率99%,还开源了。原文
07:22AI SDK@aisdk精选Vercel 的 AI SDK 最新 canary 版本(npm i ai@canary)引入了 HarnessAgent,支持 Claude Code、Codex 和 Pi 等 agent harnesses。开发者可通过 createVercelSandbox() 创建沙箱会话,并利用 AI SDK 兼容流进行交互。该功能旨在提升 agent harness 的可移植性和开发者体验。AI产品VercelAI SDKClaude CodeCodex智能体推荐理由:Vercel 这次更新很实在:用一行代码就能把 Claude Code、Codex 这些 agent 接进沙箱,还自带流式支持,写智能体项目会顺手很多。原文
06:55AWS Machine Learning Blog@Sandeep Singh精选Amazon Bedrock Guardrails 推出了 InvokeGuardrailChecks API,允许在代理式AI应用的任意阶段独立应用安全检查,无需预先创建护栏资源。该API支持内容过滤、敏感词检测等安全策略。开发者可以将其集成到多轮对话流程中,动态检查用户输入和模型输出,保障应用安全。文章提供了Python代码示例,演示如何调用此API实现安全守护。技巧Amazon BedrockGuardrailsInvokeGuardrailChecks智能体AI安全1 个信源在谈推荐理由:AWS 出了个新 API,能在智能体对话流程里随时加安全检查,不用提前配规则,挺实用。原文
06:28AK@_akhaliqData Journalist Agent是一个能将结构化数据自动转化为多模态报道的智能体,输出包括图表、文本和视频。它内置事实核查机制,每一条数据均可追溯原始来源。这个智能体旨在提升数据新闻的生产效率和可信度。AI模型Data Journalist Agent智能体多模态数据新闻事实核查推荐理由:这个Data Journalist Agent能自动把数据做成带验证的图文视频报道,做数据新闻的不用手动整合多模态了原文
06:04NVIDIA AI@NVIDIAAI73°NVIDIA Research 推出 SpatialClaw,一个无需训练的智能体,通过编写 Python 代码作为动作接口。它在持久内核中动态组合感知模块,检查中间结果并跨步骤调整策略。感知输出作为普通变量,可结合 NumPy、SciPy 等库复用。SpatialClaw 在 20 个基准上平均比先前方法高 11.2 分,在 6 种不同模型骨干上表现稳定。AI模型SpatialClawNVIDIA智能体多模态视觉推理8 个信源在谈推荐理由:SpatialClaw 不用额外训练,靠写代码搞定复杂视觉任务,在 20 个基准上平均提升 11.2 分,还兼容多种模型。原文
05:58OpenRouter@OpenRouterAIOpenRouter发布教程,教你构建对模型移除和弃用具有鲁棒性的智能体。这是首个针对实时AI模型的出口管制事件(发生在该帖子3天后)背景下的指导。教程涉及EU AI Act(2026年8月生效)、科罗拉多州ADMT法(2027年1月)和NIST AI RMF等法规要求,强调为敏感操作设置人工门控。OpenRouter Agent SDK使这一过程变得简单。技巧OpenRouterAgent SDK智能体AI安全推荐理由:OpenRouter出了个实用教程,教你用Agent SDK应对法规下模型被移除的情况。简单好用。原文