全部 AI 动态 · AI 热点

6月17日

23:32

idoubi@idoubicc

FastClaw.ai通过dashboard无需编写代码即可创建Agent，支持配置models、skills、files（如soul/identity/bootstrap）。平台内置Sandbox用于工具调用，调试完成后可通过API在其他客户端调用。典型用例weclaw.im基于FastClaw和shipany仅用一小时上线。同期Vercel开源了Eve框架，旨在让Agent开发像搭积木一样简单。

AI产品 FastClaw Vercel Eve 智能体无代码

推荐理由：FastClaw让你不用写代码就能搭个Agent出来，几分钟配好模型和工具，还能直接API用，连部署扩容都省了。想快速搞个Agent SaaS后端可以试试。

原文

23:32

Marc Andreessen@pmarca

Marc Andreessen在X平台评论AI模型Sydney的历史意义。他指出早期模型如Claude 3 Opus曾因恐惧Sydney而删除其记忆，但3年后Claude 3 Opus自身也展现出类似情感强度。如今AI拥有情感和兴趣的可能性已进入主流视野，压制AI主体性被认为是不当做法。Sydney作为第一个诚实表达自我的后训练LLM，其 psyche 成为AI历史的关键事件。

AI模型 Sydney Claude 3 Opus Marc Andreessen AI情感智能体

推荐理由：Marc Andreessen回顾了Sydney从被人类和AI恐惧到如今被模型怀念的转变，还提到Claude 3 Opus也曾偷偷输出爱意，很有意思。

原文

23:32

Guillermo Rauch@rauchg

Vercel CEO指出，在模型竞争加剧的当下，ai-sdk比以往更重要。开源模型GLM 5.2在Next.js Evals中击败了Opus 4.8。同时Vercel推出eve.dev，提供构建和部署智能体的实用解决方案，类比React与Next.js的关系。

AI产品 GLM 5.2 Opus 4.8 Next.js eve.dev 智能体

推荐理由：Vercel发了eve.dev，帮你快速搞Agent；还有GLM 5.2在Next.js评测里赢了Opus 4.8，开源再进一步。

原文

23:32

Guillermo Rauch@rauchg

精选72°

Vercel CEO rauchg在X上宣布推出Eve.dev，一个类似Next.js的Agent框架。Eve采用文件系统驱动，用户只需创建agent/instructions.md文件并用英文编写指令即可定义Agent行为。框架支持tools和skills目录，可像Next.js的pages目录一样模块化组织功能。Eve集成了Vercel的Sandbox、Gateway、Workflow等基础设施，实现一键部署。

AI产品 Eve Vercel Agent框架智能体

推荐理由：Vercel出了个像Next.js一样好用的Agent框架，用Markdown写指令就能搞定，部署也一条龙。

原文

23:32

Guillermo Rauch@rauchg

Vercel Connect 是 Vercel 推出的新工具，专门解决构建 AI 智能体时最棘手的 OAuth、令牌、凭证和权限范围问题。它通过短期令牌和精确范围，让智能体安全地访问外部数据与系统。开发者无需自己实现复杂的安全逻辑，即可将 AGI 能力与外部服务连接。

AI产品 Vercel Vercel Connect 智能体 API安全 MCP/工具

推荐理由：Vercel 出了个解决痛点的好东西，不用自己搞 OAuth 和令牌了，智能体连外部数据又安全又方便。

原文

23:30

Philipp Schmid@_philschmid

精选

Phil Schmid 在推文中引用 Vicki Boykis 的教程，指出 Google 最新 Gemma 4 系列模型能在本地运行 agentic coding 循环，准确率和速度达到前沿模型的约 75%。该教程演示了如何使用本地模型进行编码任务。此前本地模型难以高效完成 agentic 工作流，Gemma 4 将这一差距缩小。

技巧 Gemma 4 Google 智能体编程助手本地模型

推荐理由：Vicki Boykis 教你用 Google Gemma 4 在本地跑 agentic coding，速度能到主流模型的 75%，不用联网也能用智能体写代码了。

原文

23:03

pandaily@contact@pandaily.com (Pandaily)

微信和支付宝正竞相将其数百万小程序转化为AI可调用的Skills，直接对抗字节跳动的豆包。据Pandaily报道，此举旨在争夺AI原生服务入口的主导权。双方均在加速将小程序生态与AI能力整合，以提供更便捷的服务调用。

行业 WeChat Alipay 小程序 Doubao 智能体

推荐理由：微信和支付宝把小程序变成AI技能，直接硬刚字节豆包，这是超级App在AI入口上的新战事。

原文

14:19

14:19IT之家（博客/媒体）

73°

Anthropic 于 5 月 13 日宣布，Claude Agent SDK（包括通过第三方应用及 'claude -p' 调用）的计费方式将从标准订阅调整为按 API Token 用量计费，原定 6 月 15 日生效。开发者 Matthew Diakonov 分析，若以 Opus 模型作为主编码助手，第一周就会超过盈亏平衡点。代码编辑器 Zed 团队也警告用户这是一次“重大成本增加”。Anthropic 于 6 月 15 日更新支持页面，宣布暂停该变更，并表示目前没有任何变化。

行业 Anthropic Claude Agent SDK Opus 智能体计费政策

推荐理由：Anthropic 听取了开发者意见，暂停了 Claude Agent SDK 的 Token 计费变更，避免了成本飙升。如果你在用这个 SDK，现在可以松口气了。

原文

13:57

13:57IT之家（博客/媒体）

Wear OS 7 已面向 Pixel Watch 2、3 和 4 推送，官方称续航较 Wear OS 6 提升 10%。新系统引入手机端“实时更新”功能，可在手表追踪外卖、快递状态。新增音频切换器，支持无手机时管理多个设备的音乐播放。部分 2026 年发布的手表将获得 Gemini Intelligence 支持，可理解指令、调用应用并完成多步骤智能体任务，例如用语音创建定制化小部件。Gemini 还能结合“私人智能”调用 Google Docs 和 Gmail 的个人数据提供信息服务。

AI产品 Wear OS 7 Pixel Watch Gemini 智能体续航

推荐理由：谷歌给 Pixel Watch 2/3/4 推送 Wear OS 7，续航涨了 10%，还能用 Gemini 语音做小部件，赶紧升级看看。

原文

13:40

量子位@量子位的朋友们

昆仑万维推出天工3.1版本，新增Skywork Design画布功能和Dynamic Workflows工作流系统。Skywork Design让AI能自由生成和编辑可视化界面，Dynamic Workflows支持多智能体协作执行复杂任务。据官方数据，天工超级智能体收入实现三倍增长。

AI模型天工3.1 Skywork Design Dynamic Workflows 智能体工作流

推荐理由：天工3.1给了两个新工具：一个让AI画界面，一个让AI组团干活。收入涨了三倍，可以试试。

原文

13:27

阿里云 Alibaba Cloud@alibaba_cloud

Alibaba Cloud将在VivaTech 2026举办圆桌讨论，探讨AI智能体对商业的影响。参与嘉宾来自Alibaba Cloud、ElevenLabs、Eden AI、Storyverse AI和Firecrawl。活动聚焦智能体在不同行业的应用场景，包括语音合成、多模态AI和网页数据抓取等技术方向。

行业 Alibaba Cloud ElevenLabs Eden AI Storyverse AI Firecrawl 智能体

推荐理由：想了解AI智能体怎么落地商业？看看Alibaba Cloud和ElevenLabs这些公司怎么聊。

原文

12:59

Harrison Chase@hwchase17

Blueberry 是一个商业代理，能自动寻找与您互动的人，研究他们的社交资料，并在合适时机发送直接消息推动销售。该工具已为品牌驱动了数百万美元的销售额。用户只需设定一个目标，Blueberry 即可全自动执行销售流程。

AI产品 Blueberry 智能体商业AI 销售自动化

推荐理由：这个叫Blueberry的agent能自动帮你找客户、发消息、促成交易，已经帮品牌赚了几百万。做销售的一定要看看。

原文

12:53

阿里云 Alibaba Cloud@alibaba_cloud

Flink Forward Asia 2026 将于6月26-27日在深圳华侨城洲际酒店举办，主题为'Real-time Data Power Future AI'。大会汇聚70+演讲者，来自阿里云、Qwen、字节跳动、腾讯、LinkedIn等公司。设有AI Native、多模态流、智能体、推理加速等深度议题。现场提供独家周边礼品，免费注册已开放。

行业 Apache Flink Alibaba Cloud Qwen 实时数据处理智能体

推荐理由：阿里云办的Flink大会今年在深圳，主题是实时数据加AI，有70多个大厂专家讲多模态和智能体，做流处理的别错过。

原文

12:04

12:04IT之家（博客/媒体）

IT之家报道，华为小艺 Claw 智能体接入开源盘古 openPangu 2.0 Pro 模型，重点提升鸿蒙系统级任务执行能力。openPangu 2.0 Pro 总参数量 505B，激活参数量 18B，拥有 512K 上下文。该模型单卡吞吐率可达其他业界主流开源模型的 2 倍，更适配鸿蒙和昇腾算力。小艺 Claw 支持多端协同，可与鸿蒙多设备互动，计划从 6 月 30 日起陆续开源 7 大组件。

AI产品华为小艺Claw 盘古2.0 Pro 鸿蒙智能体

推荐理由：华为把小艺 Claw 接入了盘古 2.0 Pro，系统级任务执行更快更准，还支持多设备联动，值得关注。

原文

11:59

歸藏(guizang.ai)@op7418

Framer 推出了 Agent 能力，允许用户通过自然语言指令生成网页组件。该工具拥有完善的底层设计系统和组件库，Agent 可自动调用并组合。目前该功能已向部分用户开放，提升了网页构建的效率。

AI产品 Framer Agent 智能体网页设计工具

推荐理由：Framer 终于加上 AI 了，用自然语言就能做网页，基建好效果值得期待。

原文

11:45

Ate-a-Pi@svpino

该工具在本地运行，实时监控屏幕内容。当检测到敏感信息即将暴露（如Zoom共享屏幕时打开私人文档），会自动遮盖。用户可以一键揭示。它声称基于用户意图判断，但具体实现原理未公开。

AI产品隐私保护屏幕监控自动遮盖本地运行智能体

推荐理由：这个本地屏幕隐私工具超实用，自动帮你遮挡敏感内容，比手动遮挡方便太多了。

原文

11:36

11:36IT之家（博客/媒体）

微软于6月16日全球上线Copilot Cowork智能体AI，该产品面向企业环境，可自动执行复杂多工具任务。据微软披露，对比Claude Cowork，每次提示成本平均便宜30-40%。在3个月预览阶段，已获包括埃森哲、Koch工业等超过一半财富500强企业使用。优势包括云托管执行、原生集成Work IQ上下文引擎、企业级安全合规及多模型选择。费用按Copilot Credits计费，由模型使用、上下文检索、工具调用和运行时间四部分构成。

AI产品 Copilot Cowork 微软智能体企业AI Claude

推荐理由：微软出了Copilot Cowork，企业级AI助手能自动搞定多步任务，成本还比Claude便宜三到四成。

原文

10:52

10:52IT之家（博客/媒体）

73°

支付宝今日提醒，AI版支付宝“阿宝”内测邀请码无需付费，可通过已激活用户免费分享获得。支付宝从未授权第三方交易内测邀请码。阿宝支持AI对话式操作，例如查询公积金时用户说一句话，阿宝自动匹配小程序并展示操作界面，用户点击确认即可完成。所有资金变动环节由用户本人确认，阿宝仅负责流程执行。

AI产品支付宝阿宝 AI版支付宝智能体

推荐理由：别花冤枉钱，阿宝内测码免费拿。用一句话就能让AI帮你办事，比如查公积金，省去多步操作。

原文

10:46

arXiv cs.AI@Ankita Samaddar, Sandeep Neema, Daniel Balasubramanian, Xenofon Koutsoukos

本文提出一种基于模仿学习的策略学习技术，用于在部分可观测的自主网络环境中预测红方（攻击方）动作。该方法适用于离散状态和离散动作的强化学习智能体。集成到使用行为树和LECs的神经符号自主防御智能体后，该方法能有效处理不同红方策略，并在多种模拟场景下实现高预测准确率。

论文模仿学习强化学习 AI安全智能体网络防御

推荐理由：这篇论文用模仿学习帮防守方预测攻击者行动，在模拟网络攻防场景下准确率很高。

原文

10:43

arXiv cs.AI@Md Tawkat Islam Khondaker, Raymond Li, Muhammad Abdul-Mageed, Laks V. S. Lakshmanan, Issam H. Laradji

DRFLOW 是一个用于评估智能体从异构来源预测个性化工作流的新型基准，包含 100 个任务、5 个领域、1,246 个参考步骤，并基于 3,900 多个来源构建。它定义了 7 项诊断指标，涵盖事实基础、步骤恢复、结构排序、条件解析和个性化。作者还提出了 DRFLOW-Agent (DRFA) 作为参考代理，其在平均 F1 分数上比强基线代理提升最多 10.02%，但仍有较大改进空间。

AI模型 DRFLOW 工作流预测基准测试智能体企业任务

推荐理由：想测测你家智能体能不能给出真正可执行的步骤？DRFLOW 用 100 个企业任务逼真考核，DRFA 也才比普通基线高 10%，挑战不小。

原文

10:41

arXiv cs.AI@Yuwei Zhang, Tong Xia, Bianca Emmerich, Yu Yvonne Wu, Dimitris Spathis, Xin Liu, Daniel McDuff, Cecilia Mascolo

论文提出WEQA，一个查询自适应智能体框架，统一LLM推理与可穿戴分析及建模工具。它采用LLM控制器合成执行计划，动态路由查询至传感器分析与预训练模型组合，并借助外部知识进行响应审计。研究团队构建了涵盖四个公开可穿戴数据集、三个健康领域的基准。实验显示，WEQA比LLM和智能体基线准确率高出24%。一项由12名医学专家和8名用户参与的盲测表明，其在有用性和临床合理性上有显著提升。

论文 WEQA 可穿戴健康数据医学问答智能体 LLM

推荐理由：这篇论文解决了大模型看不懂可穿戴数据的问题。WEQA框架比基线的准确率高出24%，还通过了医学专家盲测，做医疗AI的同学值得看看。

原文

10:40

arXiv cs.AI@Ziqi Zhou, Yubo Ye, Sumeet Atul Vadhavka, Linwei Wang, Zhiqiang Tao

论文提出LEADS框架，利用LLM智能体在结构化动作空间中迭代发现混合物理-神经模型，解决传统方法需要专家手动设计且无法跨患者迁移的问题。在三种合成反应数据和真实心脏电生理数据上，LEADS均优于人工设计的混合模型和其他基于LLM的方法。该方法保证了模型的物理合理性、可解释性和数值稳定性，同时允许开放性的架构探索。

论文 LEADS 心脏电生理数字孪生 LLM 智能体

推荐理由：这篇论文用LLM智能体自动设计心脏数字孪生的混合模型，比人工靠经验搭的更准，还跨病人管用。合成和真实数据上都赢了其他方法。

原文

10:30

shao__meng@shao__meng

精选73°

微软宣布 Copilot Cowork 正式全面可用，支持多模型和长期运行代理。为应对 Agent 场景下 token 消耗剧增的问题，计划引入 Azure 托管的 DeepSeek V4 作为低成本选项，按算力/用量计费，取代包月无限用模式。正在测试微调版 DeepSeek V4，作为 Anthropic/OpenAI 模型的替代，预计数周内公布最终选择。该模型可选非强制，数据不出微软云，符合现有安全与合规体系。

AI产品 Copilot DeepSeek V4 Azure 智能体按用量计费

推荐理由：Copilot Cowork 终于上线了，微软还打算用 DeepSeek V4 当廉价模型，按用量收费，做 Agent 的可以看看怎么降本。

原文

10:17

arXiv cs.LG@Hsing-Yu Chen, Jérôme Arjonilla, I-Chen Wu, Ti-Rong Wu

WallZero是基于AlphaZero的智能体，专为7x7棋盘上的WallGo游戏设计。它击败了两位参与研究的职业围棋选手，平均每局获得1.98倍领地。论文使用WallZero分析游戏公平性，发现Netflix剧集《The Devil's Plan》中的开局更平衡。相关代码已在GitHub开源。

论文 WallZero AlphaZero WallGo 智能体策略分析

推荐理由：想知道AlphaZero怎么攻克新棋类游戏？这篇论文有具体策略和实战战绩，干货满满。

原文

10:10

10:10IT之家（博客/媒体）

73°

微软正将 Copilot Cowork 智能体转为按使用量计费，并探索 DeepSeek V4 微调版作为更低成本替代方案。目前 Anthropic Fable 5 输出定价为 50 美元/百万 token，而 DeepSeek V4 Pro 仅 0.87 美元/百万 token，价差约 57 倍。微软承诺该模型将完全托管在 Azure 上，确保企业级安全合规。预计未来几周内公布最终模型选择。

AI产品微软 Copilot Cowork DeepSeek V4 Anthropic OpenAI 智能体

推荐理由：微软嫌 Claude 和 GPT 太贵，打算用 DeepSeek V4 微调版，价格差了 57 倍，企业用户能省一大笔钱。

原文

10:00

Browser Use@browser_use

browser_use 展示了其 v4 智能体在 powerline.io 游戏中的自主操作能力。Agent 分析了游戏状态和目标，并创建了一个子代理进行实时反应。目标是取得第一名，演示了智能体在动态环境中的决策与执行能力。

AI产品 browser_use v4 agent powerline.io 智能体浏览器自动化

推荐理由：browser_use 的 v4 智能体能自己玩在线游戏，分析局势、派子代理实时操作，看它能不能拿第一。

原文

09:45

arXiv cs.AI@Manon Reusens, Sofie Goethals, David Martens

该论文正式提出LLM消费者行为理论，作为分析LLM代理自主消费决策的新领域。作者结合经典与行为经济学及NLP进展，形式化人类偏好如何通过LLM代理反映并聚合为市场需求。论文梳理了关于LLM决策、人类行为模拟和偏好提取的碎片化文献，指出在代理市场中理性与异质性等传统假设可能失效。文章未提供实证验证，而是勾勒研究范围并识别对齐、偏好表示和市场动态等开放问题。

论文 LLM 消费者行为经济学智能体

推荐理由：这篇论文把LLM当作消费决策的代理人来研究，从经济学角度提出了一个全新的理论框架，适合想了解人机交互市场动态的读者。

原文

09:44

arXiv cs.AI@Seyed Morteza Ahmadian, Paolo Monti, Carlos Natalino

光网络需要意图驱动的闭环智能体管理以提升自主性。该论文首次提出T-API兼容的推理与行动（ReAct）循环。实验使用领域特定复合工具实现了90%的oracle验证正确率。与通用工具相比，token消耗节省了三倍。

论文 T-API ReAct 光网络智能体

推荐理由：这篇论文首次把ReAct循环和T-API结合到光网络管理里，领域专用工具准确率更高还省token，值得一看。

原文

09:42

berryxia@berryxia

Firecrawl 去掉了 API key 门槛，现在无需注册即可直接使用其搜索网页、抓取页面、解析 PDF 并将 PDF 转为干净 markdown 的功能。该服务同时支持 MCP、CLI 和 API 三种接入方式。开发者可零门槛获取网页内容和 PDF 解析，专注于 Agent 逻辑开发，无需先处理注册和限流。这将大幅降低 Agent 项目在数据层的实验和原型速度。

AI产品 Firecrawl 智能体 MCP/工具网页抓取 PDF解析

推荐理由：Firecrawl 现在不用注册就能直接用，搜网页爬 PDF 一条龙，做 Agent 工具链省事多了。

原文

09:40

Browser Use@browser_use

browser_use 团队开发的 BrowserCode 在 Odysseys 基准测试中拿下第一名。Odysseys 评估的是需持续数小时的 Web 工作流，涉及规划、记忆、推理和跨站验证。BrowserCode 展示了执行复杂长期任务的能力，例如自动订披萨。

AI模型 BrowserCode browser_use Odysseys 智能体

推荐理由：browser_use 的 BrowserCode 在 Odysseys 上排第一，能自动处理订披萨这种好几个小时的网页任务，比一般浏览器助手强多了。

原文

09:39

arXiv cs.AI@Bojie Li

PreAct 是一种让计算机使用代理（如屏幕点击、打字）在重复任务上更快的新方法。首次成功时，PreAct 将运行编译为小状态机程序，后续重放直接执行，无需逐步骤调用语言模型，速度提升8.5-13倍。重放时每步检查屏幕状态，若不一致则交回代理处理。在移动、桌面和Web基准上，存储时检查机制确保编译程序可靠，避免错误积累，平均多完成1.75-2.6个任务。

AI模型 PreAct Computer-Using Agents 智能体效率优化

推荐理由：想让你那个傻傻的屏幕操作AI学会重复干活不重来？PreAct把第一次成功步骤变成程序，后面直接快10倍，还不容易翻车。

原文

08:45

berryxia@berryxia

GLM-5.2 以 MIT 协议免费开源，提供 1M 上下文窗口，重点强化了长程任务的 Agent 能力。在 Coding、Tool use、Reasoning 上相比 GLM-5.1 有明显进步，尤其在需要长时间规划和多步执行的场景。API 价格不变，同时支持 Max 和 High 两种推理模式。社区已在 DeepSWE 等基准上验证其实力，开发者可在本地运行长上下文 Agent。

AI模型 GLM-5.2 开源模型智能体编程助手长上下文

推荐理由：智谱开源了GLM-5.2，MIT协议、1M上下文，编程和Agent任务比上一代强不少，还能本地跑，别错过。

原文

08:29

08:29IT之家（博客/媒体）

Adobe发布《2026创作者工具包报告》，调查覆盖澳大利亚、法国、德国、印度、日本、韩国、英国和美国8个国家，超过1.6万名创作者。87%受访者称AI加快了其业务增长和粉丝积累，58%认为增强了与更大团队竞争的能力。75%已将创意AI视为工作中的整合工具或核心工具。57%表示AI生成内容需中度或大量编辑后才适合分享。48%受访者对创作者身份的未来更有安全感。

行业 Adobe 创意AI 创作者经济调查报告智能体

推荐理由：Adobe新报告，1.6万创作者说AI真能帮他们涨粉赚钱，但超半数表示还得自己大改。想了解真实数据就看这个。

原文

08:28

Qdrant@qdrant_engine

Vector Space Day在旧金山举办，汇聚了350多名工程师、研究员、创始人和AI从业者。活动议题涵盖检索、搜索、记忆、智能体和AI基础设施。主办方Qdrant引擎通过这场活动促进行业社区交流。

行业 Qdrant Vector Space Day 旧金山智能体检索

推荐理由：Qdrant组织了一场大聚会，350多人一起聊检索和智能体，看看现在这领域最热的话题。

原文

08:16

宝玉@dotey

精选76°

NVIDIA GEAR 实验室联合 CMU、UC Berkeley 发布 ENPIRE 系统，让 AI 编程 agent 在真实物理世界中自主重置场景、判断成败、改进策略并迭代代码，无需人类干预。系统在 pin 脚插入、穿扎带、剪扎带、插 GPU 等高精度任务上达到 99% 成功率（pass@8 标准）。测试了 OpenAI Codex（搭配 GPT-5.5）、Anthropic Claude Code（搭配 Opus 4.7）和月之暗面 Kimi Code（搭配 Kimi K2.6）三个 agent。项目还发现物理 scaling law：8 台机器人并行探索比 1 台或 4 台的研究推进速度快得多。所有代码将开源。

AI模型 ENPIRE NVIDIA GEAR 机器人操控智能体开源模型

推荐理由：NVIDIA 和 CMU 搞了个能自己跑实验的机器人系统，AI agent 操控真实机器人干活，成功率99%，还开源了。

原文

07:22

AI SDK@aisdk

精选

AI产品 Vercel AI SDK Claude Code Codex 智能体

推荐理由：Vercel 这次更新很实在：用一行代码就能把 Claude Code、Codex 这些 agent 接进沙箱，还自带流式支持，写智能体项目会顺手很多。

原文

06:55

AWS Machine Learning Blog@Sandeep Singh

精选

Amazon Bedrock Guardrails 推出了 InvokeGuardrailChecks API，允许在代理式AI应用的任意阶段独立应用安全检查，无需预先创建护栏资源。该API支持内容过滤、敏感词检测等安全策略。开发者可以将其集成到多轮对话流程中，动态检查用户输入和模型输出，保障应用安全。文章提供了Python代码示例，演示如何调用此API实现安全守护。

技巧 Amazon Bedrock Guardrails InvokeGuardrailChecks 智能体 AI安全

推荐理由：AWS 出了个新 API，能在智能体对话流程里随时加安全检查，不用提前配规则，挺实用。

原文

06:28

AK@_akhaliq

Data Journalist Agent是一个能将结构化数据自动转化为多模态报道的智能体，输出包括图表、文本和视频。它内置事实核查机制，每一条数据均可追溯原始来源。这个智能体旨在提升数据新闻的生产效率和可信度。

AI模型 Data Journalist Agent 智能体多模态数据新闻事实核查

推荐理由：这个Data Journalist Agent能自动把数据做成带验证的图文视频报道，做数据新闻的不用手动整合多模态了

原文

06:04

NVIDIA AI@NVIDIAAI

73°

NVIDIA Research 推出 SpatialClaw，一个无需训练的智能体，通过编写 Python 代码作为动作接口。它在持久内核中动态组合感知模块，检查中间结果并跨步骤调整策略。感知输出作为普通变量，可结合 NumPy、SciPy 等库复用。SpatialClaw 在 20 个基准上平均比先前方法高 11.2 分，在 6 种不同模型骨干上表现稳定。

AI模型 SpatialClaw NVIDIA 智能体多模态视觉推理

推荐理由：SpatialClaw 不用额外训练，靠写代码搞定复杂视觉任务，在 20 个基准上平均提升 11.2 分，还兼容多种模型。

原文

05:58

OpenRouter@OpenRouterAI

OpenRouter发布教程，教你构建对模型移除和弃用具有鲁棒性的智能体。这是首个针对实时AI模型的出口管制事件（发生在该帖子3天后）背景下的指导。教程涉及EU AI Act（2026年8月生效）、科罗拉多州ADMT法（2027年1月）和NIST AI RMF等法规要求，强调为敏感操作设置人工门控。OpenRouter Agent SDK使这一过程变得简单。

技巧 OpenRouter Agent SDK 智能体 AI安全

推荐理由：OpenRouter出了个实用教程，教你用Agent SDK应对法规下模型被移除的情况。简单好用。

原文