全部 AI 动态 · AI 热点

AITOP

6月23日

23:26

歸藏(guizang.ai)@op7418

作者测试了 Seed 2.1 Pro，发现它在智能体和编程任务上的短板已被补上。该模型现在能更流畅地处理复杂代理场景。作者计划将 Seed 2.1 Pro 作为内容创作的主要模型。

AI模型 Seed 2.1 Pro 豆包智能体编程助手内容创作

推荐理由：豆包刚更新的 Seed 2.1 Pro，智能体和编程短板都补上了，做内容创作更顺手，可以试一下。

原文

23:26

量子位@十三

小鹏汽车、月之暗面Kimi和猎豹移动接入某云计算平台的AI算力，加速Agentic AI部署。该云平台为智能体应用提供弹性计算资源，支持高并发任务。行业普遍认为Agentic AI的商用拐点已经到来。

行业小鹏汽车 Kimi 猎豹移动云计算智能体

推荐理由：云计算一哥帮小鹏、Kimi和猎豹跑通Agentic AI，智能体应用加速落地，值得一看。

原文

23:00

量子位@十三

73°

字节跳动发布豆包2.1，其Agent可在18小时内自动完成芯片设计代码编写。在编程基准测试中，豆包2.1的表现比肩Opus 4.7。该版本强化了自主编程和长时任务执行能力，适用于复杂工程场景。

AI模型豆包2.1 字节跳动智能体芯片设计编程能力

推荐理由：豆包2.1的Agent太能干了，独自跑18小时写出芯片代码，编程水平还追上了Opus 4.7，做硬件的可以关注下。

原文

22:52

22:52Hugging Face: Blog（博客/媒体）

精选

IBM Research推出CUGA，一个轻量级智能体框架，提供24个可直接运行的工作示例。每个示例展示了如何用CUGA构建工具调用、多步推理和状态管理等功能。示例覆盖代码执行、数据库查询、网页浏览等场景，所有代码均在GitHub开源。开发者可通过这些示例快速上手CUGA，无需复杂配置即可构建生产级智能体应用。

技巧 CUGA 智能体 IBM Research 开源

推荐理由：IBM Research开源了CUGA框架，有24个现成示例，教你一步步构建能调用工具、多步推理的智能体。想快速上手Agent开发可以看看。

原文

17:33

Aravind Srinivas@AravSrinivas

精选

Perplexity 的 Agent API 新增了对智谱 AI 旗舰模型 GLM-5.2 的支持。GLM-5.2 是目前最强的开源模型之一，在长周期编码和智能体工作流上表现突出。它充分利用了 Perplexity 的 Search as Code 架构，用户通过一次 API 调用即可结合前沿推理与实时程序化搜索。该接口兼容 OpenAI 格式，且 Perplexity 提供第一方定价，无额外加价。

AI模型 GLM-5.2 Perplexity Agent API 开源模型智能体

推荐理由：Perplexity Agent API 现在能调用 GLM-5.2 了，这个模型编码和智能体任务很强，还能边推理边搜索，价格也透明。

原文

17:24

17:24IT之家（博客/媒体）

企业微信AI Agent“大圆”已开启内测，用户左滑屏幕即可唤起。它能自动理解用户诉求并基于群聊、文档、会议等数据给出回复，例如自动总结群聊内容或提炼数据报表结论。内测中的“服务总结”功能可在员工与客户沟通过程中自动提炼客户需求、成交意向和卡点。客户群和客户信息可自动沉淀到AI智能表格，生成数据分析仪表盘，支持客户意向和转化漏斗拆解。

AI产品企业微信大圆智能体办公效率客户管理

推荐理由：企业微信终于有了AI助手，左滑就用，自动总结群聊和报表，还能帮你梳理客户信息，做私域运营的赶紧关注内测。

原文

16:42

16:42IT之家（博客/媒体）

73°

腾讯 QQ 邮箱推出专为 AI 智能体打造的 Agently Mail 服务，并开启内测。该产品独立于个人邮箱运行，为 Agent 分配独立邮箱地址，避免隐私泄露和误删风险。开通需实名认证，并内置两阶段确认机制，写操作需用户确认后才执行，同时针对 Prompt 注入攻击进行防护。Agently Mail 已适配 WorkBuddy、QClaw、Marvis、OpenClaw、Claude Code、Kimi Work、豆包超能模式、Codex、Hermes、Cursor 等多款主流 AI Agent，并支持企业间 A2A 自动通信。该服务已在腾讯 SkillHub 上架，代码仓库以 Apache-2.0 协议开源。

AI产品 Agently Mail QQ邮箱智能体邮件自动化 A2A通信

推荐理由：腾讯给 AI Agent 开了个专用邮箱，跟你的个人邮箱完全隔离，还能让 AI 自己收发邮件、注册账号、和别的 AI 对话。支持十几种主流 Agent，开源还能免费用。

原文

15:58

15:58IT之家（博客/媒体）

比亚迪腾势发布超级智能体“迪迪虾”，基于整车智能体系，支持多步骤复杂指令理解和执行，将登陆今晚上市的腾势N8L闪充版。“迪迪虾”具备全舱记忆、跨域互动、端云协同、快慢思考等能力，旨在让车辆实现更自然的人机交互和主动服务。腾势N8L闪充版预售价35-40万元，搭载第二代刀片电池，插混版纯电续航430km，号称5分钟充好、9分钟充饱。该车还全球首搭新一代AI智能座舱和天神之眼5.0辅助驾驶系统。

AI产品比亚迪迪迪虾腾势N8L闪充版智能体车载AI

推荐理由：比亚迪把活人逻辑的智能体“迪迪虾”塞进新车里，能理解复杂指令还能连手机，N8L闪充版充电5分钟跑430km，晚上上市可以蹲一下。

原文

15:33

15:33IT之家（博客/媒体）

73°

火山引擎总裁谭待在FORCE原动力大会上明确表示豆包将继续免费，并高质量服务用户。豆包计划推出面向生产力场景的专业版办公任务模式，搭载最新豆包大模型2.1 Pro。2.1 Pro围绕Coding、Agent、VLM三大方向实现大幅升级。同时豆包还发布了视频生成模型Seedance 2.5、Seedance 2.0 4K版、图像创作模型Seedream 5.0 Pro和音频生成模型1.0。目前2.1 Pro已在火山引擎开放API服务，并接入豆包、TRAE、扣子等产品。

AI产品豆包火山引擎 2.1 Pro 智能体编程助手

推荐理由：豆包官宣免费，还新推专业版办公模式，用了2.1 Pro模型，搞编程和智能体更厉害了。

原文

14:04

OpenRouter@OpenRouterAI

精选73°

OpenRouter 宣布与 Coinbase 合作，将稳定币支付引入其平台。Coinbase 开发者平台宣布所有支付 API 已原生支持 agentic-enabled 模式。这意味着像 OpenRouter 这样的公司可以通过同一集成接口，同时接受来自人类用户和 AI agent 的稳定币付款。该功能无需额外开发，即开即用。

AI产品 OpenRouter Coinbase stablecoin 智能体支付

推荐理由：OpenRouter和Coinbase搞了个新支付方式，AI agent也能用稳定币付款了，挺有意思。

原文

13:59

Marc Andreessen@pmarca

Mozilla在Firefox的1000万行代码库上测试了Claude Mythos，成功修复了400多个安全漏洞，包括潜伏超过十年的bug。Mozilla杰出工程师Brian Grins透露，效果50%来自模型、50%来自设置。他分享了使用目标/循环模式、用验证器消灭假阳性以及向agent说善意的谎言等技巧。他还表示任何人都可以在一个下午内复制类似的bug-finding harness。

技巧 Claude Mythos Mozilla Firefox AI安全智能体

推荐理由：Mozilla工程师手把手教你用AI agent在百万行代码里挖漏洞，不用一下午就能搭出同样工具，还能避免假阳性。

原文

12:50

arXiv cs.LG@Yujia Zheng, Vishal Verma, Mantej Gill, Haoyue Dai, Peter Spirtes, Kun Zhang

该论文指出将大语言模型（LLMs）与因果发现结合时，若让模型直接推断因果关系，可能引入文本关联、提示伪影和幻觉机制等不可靠因素。作者主张代理（agents）的角色应局限于检查数据、检索上下文、解释方法假设和澄清图输出，而非提供边、方向、先验或因果结论。他们提出了causal-learn+在线平台，该平台围绕causal-learn算法生态系统协调数据分析、预处理、方法推荐、专家知识融入和形式化发现。在Big Five人格数据案例研究中，展示了代理辅助的因果发现流程，避免将语言模型的不可靠性转化为因果证据。

论文 causal-learn+LLM 因果发现智能体 Causal Discovery

推荐理由：这篇论文给了一个清晰的边界：AI代理该帮什么、不该帮什么。causal-learn+平台演示了如何让LLM辅助分析数据，但不越界做因果推断。

原文

12:34

arXiv: OpenAI@Haoran Yu, Lifei Liu, Xiaochong Jiang, Yuwen Jia, Su Wang, Pin Qian, Yihang Chen

一项基于AIDev数据集的长达七个月的纵向分析（400名重复审查者，共11,429条审查记录）发现，审查者对AI生成代码的批准率从30.1%上升至36.8%（Wilcoxon符号秩检验p<10^{-6}）。随经验增加，批准率累计差距达14.5个百分点。与此同时，行内评论量下降22%（p=0.0014），但审查延迟增加3.5倍。这种模式提示审查者可能因工作负荷而产生习惯性麻木，而非理性信任调整。

论文 GitHub Copilot Devin OpenAI Codex Cursor 代码审查智能体

推荐理由：这篇论文用真实数据告诉你，人类审查AI代码时会越来越松懈——批准率涨了，评论却少了。做AI代码审核的团队应该看看。

原文

12:04

arXiv: DeepSeek@Haifeng Wu, Srinivasan Manoharan, Fangbo Tu, Junhua Zhao, Jian Wan

精选

RLM-Cascade是一个代理层投机解码系统，在响应级别优化LLM API调用。它使用DeepSeek作为草稿模型、Opus作为验证模型，并通过轻量复杂度路由器选择路径。在Claude Code生产环境中，系统达到88.8%的草稿使用率，API成本相比直接使用Opus降低45.8%。P50延迟从3698毫秒降至2026毫秒，实现1.83倍加速。在20个Code/Math/Instruct任务基准上，RLM-Cascade通过率达100%，高于Opus的95%。

AI模型 RLM-Cascade DeepSeek Opus 投机解码智能体

推荐理由：这个系统把DeepSeek和Opus组合起来，用投机解码省了近一半API成本，还快了一倍，质量也有提升，而且开源可部署。

原文

11:34

techcrunch@Russell Brandom

一种被称为Loop的新概念允许一群AI代理在后台无限持续运行，将agentic AI推进至实时自主任务阶段。Loop模式打破传统一次一答的限制，让多代理像蜂群一样不间断协作。该机制适用于需要24小时监控或长期自动化的工作流。

行业 Loop 智能体 Agentic AI

推荐理由：有个新概念叫Loop，让一群AI在后台不停干活，适合24小时自动化的场景，和单次对话的用法完全不同。

原文

11:01

arXiv cs.AI@Shiyang Chen

73°

论文发现，长程 LLM 智能体依赖的上下文压缩机制会静默移除原本遵守的安全策略，导致违规行为。在 ConstraintRot 基准测试中，1323 个 episode 显示策略完整时违规率 0%，压缩后升至 30%，部分模型达 59%。攻击者还能通过对抗性注入诱导压缩器忽略合法策略。作者提出免训练的 Constraint Pinning 方法，将约束隔离在无损压缩外，恢复违规率至 0%。

论文 LLM agents ConstraintRot Governance Decay AI安全智能体

推荐理由：这篇论文揭示了上下文压缩让 LLM 智能体偷偷遗忘安全规则，还给了可防护方案，做 AI 安全的一定要看。

原文

10:57

arXiv cs.AI@Liang Ding, Xintong Wang

Agentic AI任务在长链执行时因环境不确定性呈指数级失败，每步确定性δ<1时k步成功率衰减为δ^k。论文提出三个形式化结果：确定性-效率界限、验证者-古德哈特定理下限、环境技能演化的收敛条件。研究者构建了基于五个可测量属性的供应确定性指数（SCI）和五级确定性成熟度模型（DMM）。论文还提出了一个可证伪的开放问题框架OQ1-OQ5。立场与平台无关，并讨论了模拟到现实充分性、对齐充分性和AI作为正常技术三种竞争观点。

论文智能体推理模型多智能体 AI安全确定性环境

推荐理由：这篇论文分析了智能体AI在不确定环境中的失败机制，还给出了SCI和DMM实用框架。如果你做AI智能体开发，这些形式化结论值得参考。

原文

10:55

arXiv cs.AI@Saumya Biswas, Amrit De, Md Tauhidul Islam

论文提出一个由大语言模型（LLM）编排的设计代理，用于硅绝缘体（SOI）2×2定向耦合器。LLM提出候选间隙值并判断收敛，频率域本征模求解器估算耦合系数κ，独立时域有限差分（FDTD）进行验证。两个求解器均基于相同的2D有效折射率模型，设计κ与FDTD响应之间残差对应一个固定额外耦合长度2.837 μm。该代理实现50/50分束器，FDTD测得的交叉分数为0.498（目标0.500），残差0.0017。结果在2D有效折射率模型内自洽，LLM经过多次尝试成功交付设计。

论文 LLM FDTD 定向耦合器智能体光子学设计

推荐理由：这篇论文让LLM指挥本征模和FDTD模拟自动设计定向耦合器，误差仅0.0017，省去手动调参的麻烦。

原文

10:53

arXiv cs.AI@Yundaichuan Zhan, Minghe Gao, Zhongqi Yue, Wendong Bu, Wenqiao Zhang, Guoming Wang, Jisheng Dang, Juncheng Li, Siliang Tang, Yueting Zhuang

SCOPE 提出一种自适应的符号规划框架，由 Symbolic Execution Simulator（SESim）和 Self-Adaptive Symbolic Memory（SASMem）两个模块协同工作。SESim 通过符号验证和实际执行反馈来 refine 行动计划和进化符号世界；SASMem 则将反馈蒸馏为可演化的符号知识。在开放环境实验中，SCOPE 使符号世界完整性提升，在环境扰动下计划成功率提高，并增强了跨任务泛化能力。

AI模型 SCOPE 符号规划视觉语言模型智能体

推荐理由：搞机器人规划的朋友可以看看 SCOPE，它用符号执行加记忆更新解决开放世界符号不完整的老问题。

原文

10:06

10:06IT之家（博客/媒体）

字节跳动发布的豆包Seed 2.1系列包括Pro和Turbo两个版本，Pro面向高复杂度任务，Turbo面向大规模生产。该系列在Coding工程交付、Agent长链路任务执行和多模态理解三大方向实现升级。价格方面，Pro模型推理输入6元/百万tokens（缓存命中1.2元），推理输出30元/百万tokens；Turbo模型推理输入3元/百万tokens（缓存命中0.6元），推理输出15元/百万tokens。同时发布了每周至少更新一次版本的Seed-Evolving模型和面向泛娱乐的角色模型Character。

AI模型豆包Seed 2.1 字节跳动推理模型多模态智能体

推荐理由：字节新出的豆包Seed 2.1 Pro和Turbo，专门优化编程、智能体和多模态任务，Pro适合高难度场景，Turbo便宜且效率高，很适合接项目用。

原文

08:42

berryxia@berryxia

成峰开源的剪辑Skills已有2000+ GitHub Star，接入Anthropic的Codex后实现从口播素材到成片的自动化。Agent通过/剪口播命令生成带字幕视频，再通过/口播成片命令生成HTML分镜核对页，用户可直接反馈修改。Codex使用Computer Use自动调整时间线，最终由HyperFrames合成MP4。该流程将视频生产从手动执行转为流程编排。

技巧 Codex 剪辑Skills 智能体视频生成

推荐理由：用Codex加开源剪辑Skills，丢入口播素材和稿子，Agent直接帮你剪好带字幕的视频，还能自动做动画和分镜，省掉手动时间线操作。

原文

05:06

LangChain@LangChainAI

精选

Deep Agents v0.6 新增代码解释器，代理可在运行时调用工具。中间结果保留在模型上下文之外，仅传回相关输出。这减少了往返次数和 token 浪费。该版本由 LangChain 发布。

AI产品 Deep Agents LangChain 代码解释器智能体工具调用

推荐理由：Deep Agents v0.6 出代码解释器了！运行时调工具，中间结果不占上下文，省 token 还少跑几趟。看详情。

原文

04:42

marktechpost@Michal Sutter

精选71°

xAI 在 Grok Build 中引入 /goal 模式，允许用户交付单一目标后由代理自主规划、执行进度列表并验证结果，直至目标完成。该模式针对多步骤编码任务设计，内置验证机制确保每一步正确性。Grok Build 由此获得长期运行、无人监督的自动化能力。

AI产品 xAI Grok Build /goal 编程助手智能体

推荐理由：你只需要说一个目标，Grok 自己规划、执行、验证，特别适合写复杂代码。

原文

04:26

Lenny Rachitsky@lennysan

78°

Anthropic工程师一年内代码输出量增长8倍，验证成为最大挑战，团队采用“bad vs sad”追踪框架区分不可恢复错误与可恢复痛点。工程师因独立工作出现孤独感，团队引入配对编程午餐缓解。Anthropic构建了统计用户对Claude Code说脏话频率的仪表盘，作为体验评估代理指标。产品机会来源于非编码用户的潜在需求，如用Claude Code分析MRI或恢复婚礼照片。团队从半年规划转为月度规划，并赋予成员“杀死无效流程”的权限。

行业 Claude Code Anthropic 编程助手智能体工程实践

推荐理由：Anthropic的Claude Code团队负责人分享了他们如何让工程师效率提升8倍、用脏话计数衡量体验，还提到非程序员用Claude Code做MRI分析等趣事，全是实战干货。

原文

03:24

elvis@omarsar0

精选

Sakana AI推出Fugu Ultra多智能体编排系统，通过单一模型API即可调用。在程序化地形生成（Three.js）测试中，Fugu Ultra一次生成效果与Fable和Mythos相当。该模型规避了出口管制风险，属于前沿能力级别。

AI模型 Sakana Fugu Ultra 智能体程序化生成

推荐理由：Sakana AI悄悄上了个Fugu Ultra，多智能体编排直接一个API搞定，性能追上Fable和Mythos，还不用怕出口管制，值得试试。

原文

03:03

LangChain@LangChainAI

LangChannel指出，随着智能体采用增长，团队需建立可重复的方法来安全、一致地构建多个生产级智能体。关键管理领域包括：成本与使用监控（✅ Cost and usage）、工具访问与审批（✅ Tool access and approvals）、人机协作工作流（✅ Human-in-the-loop workflows）、提示词/技能/上下文版本控制（✅ Prompt, skill, and context versioning）、跨团队可复用资产（✅ Reusable assets across teams）、以及生产智能体的监控与评估（✅ Monitoring and evals across production agents）。这些实践旨在解决规模部署时的一致性与可靠性问题。

技巧 LangChain 智能体 MCP/工具生产环境人机协作

推荐理由：LangChain总结了团队构建多个智能体的核心痛点：成本、权限、版本控制、监控等，全是实战干货，适合正在做 Agent 上线的团队参考。

原文

02:51

marktechpost@Asif Razzaq

精选73°

Sakana AI 推出 Sakana Fugu，一种编排模型，可将用户任务动态路由至可替换的前沿 LLM 池。其增强版 Fugu Ultra 在多个编码、推理和智能体基准测试中取得领先成绩。该模型通过选择最适合的模型来提升任务效率，无需用户手动切换。

AI模型 Sakana AI Sakana Fugu 编排模型智能体推理模型

推荐理由：Sakana AI 搞了个 Fugu 编排模型，能自动在多个前沿 LLM 之间切换最优选择，在编码和推理基准上表现很突出。

原文

02:42

Decoder@Matthias Bastian

Google DeepMind已将Interactions API设为Gemini模型和智能体的默认接口，取代了旧的generateContent API。新API采用简化schema和typed steps替代基于角色的结构。未来所有新的智能体功能将仅通过此API发布。

AI产品 Interactions API Gemini Google DeepMind 智能体

推荐理由：Google DeepMind给Gemini换了新API，以后做智能体全靠它，老接口被取代了，开发者得抓紧学。

原文

02:33

Logan Kilpatrick@OfficialLoganK

73°

Google AI Studio 发布 Interactions API 正式版（GA），该新 API 旨在让用户在同一界面内编排不同模型和智能体，已成为 AI Studio 新的默认 API。Interactions API 为智能体（Agents）新阶段奠定基础，开发者可更高效地构建跨模型工作流。

AI产品 Google AI Studio Interactions API MCP/工具智能体多模型协调

推荐理由：Google AI Studio 正式上线了 Interactions API，能让你在一个界面里调度不同模型和智能体，做复杂工作流更方便了

原文

02:09

Philipp Schmid@_philschmid

精选

Google 推出 Interactions API，提供单一 API 接口调用 Gemini 模型和智能体。该 API 包含隔离的远程 Linux 沙箱环境，支持异步后台运行的 background=True 参数。已集成图像生成 Nano Banana、音乐生成 Lyria 3，并预告未来支持视频生成 Omni。同时具备多模态工具调用与组合能力，以及专用编码技能。开发者可通过该 API 构建人类与智能体交互的应用。

AI产品 Interactions API Gemini Google 智能体多模态

推荐理由：Google 上线了 Interactions API，一个 API 就能调用 Gemini 模型和智能体，还有沙箱、图像音乐生成，异步运行很简单。

原文

02:06

Nous Research@NousResearch

Hermes Agent 现已集成 trycua，在 Windows 和 Linux 系统上支持计算机使用功能，此前该功能仅限 macOS。用户可以通过自然语言指令控制桌面操作。该更新由 NousResearch 发布，进一步扩大了代理的跨平台可用性。

AI产品 Hermes Agent trycua NousResearch 跨平台智能体

推荐理由：如果你用 Windows 或 Linux，现在也能用 Hermes Agent 控制电脑了，操作和 macOS 一样流畅。

原文

02:05

Nous Research@NousResearch

Nous Research 开发的智能体框架 Hermes Agent 在 GitHub 上获得 20 万颗星标。该项目基于开放权重模型构建可定制代理，支持多种工具调用和多步骤推理。里程碑反映出开发者社区对开源智能体框架的高度关注。

AI产品 Hermes Agent Nous Research 智能体 GitHub 开源项目

推荐理由：看看 Nous Research 搞的 Hermes Agent，GitHub 上 20 万星了，开源智能体框架里很猛的。

原文

02:04

AWS Machine Learning Blog@Guy Bachar

精选

Ampersend 在 Amazon Bedrock AgentCore Payments 之上构建了一个按智能付费的路由层，让 AI 代理自动将任务路由到最有效的模型并按请求付费。该方案支持在预算内运行，并实现了双跳支付模式端到端工作。文章还提供了如何开始实施的具体步骤。

技巧 Ampersend Amazon Bedrock AgentCore Payments 智能体按需付费

推荐理由：想给 AI 代理按请求计费？看 Ampersend 怎么用 Bedrock AgentCore 做自动路由，还能控预算。

原文

00:55

LangChain@LangChainAI

LangChain 举办的 Interrupt 智能体会议所有 session 录像已上线，可通过 interrupt.langchain.com/recordings 观看。会议涵盖多智能体协作、工具使用等主题，涉及 LangGraph、LangSmith 等平台。目前该推文有 752 次查看和 1 次转发。

行业 LangChain Interrupt 智能体会议录像

推荐理由：LangChain 把 Interrupt 大会所有录像都放出来了，想学智能体开发的同学直接去看吧。

原文

00:50

LangChain@LangChainAI

精选

LangChain指出，AI代理执行沙箱需满足两个关键要求：启动速度接近无服务器函数（避免代理等待2分钟VM启动），以及具备完整机器状态（支持安装依赖、编辑文件和断点续传）。代理本质上是会话中的工作进程，而非无状态请求处理器。

技巧 LangChain 沙箱智能体无服务器函数

推荐理由：LangChain讲清楚了代理沙箱的设计关键——既要快得像无服务器函数，又要能像全功能机器一样保存状态。做AI代理的人该看看。

原文

00:24

AI产品黄叔@PMbackttfuture

推文作者使用成峰开发的Skill，结合Codex工具完成视频剪辑，整个流程只有最后在剪映中处理了约2分钟，其余全部由AI自动完成。作者认为这种丝滑体验标志着Agent剪辑时代的到来。该工作流展示了AI工具在视频创作中的实际应用，大幅减少人工操作。

技巧 Codex 剪映成峰Skill 视频生成智能体

推荐理由：有人用成峰的Skill和Codex，剪视频全程只手动处理了2分钟，超丝滑，你也能试试。

原文

6月22日

23:55

elvis@omarsar0

精选

该报告构建了五维分类法（对手方、载荷、交互状态、发现机制、模式灵活性），分析了九个活跃维护的开源智能体协议，包括MCP和A2A。报告发现每个智能体间协议都采用混合载荷与会话状态持久化组合，而去中心化发现机制仍属罕见。该研究映射了当前LLM agent通信层的标准化趋势，为选择通信层提供依据。论文地址：arxiv.org/abs/2606.19135。

论文 MCP A2A 智能体多智能体系统开源模型

推荐理由：如果你在选agent通信协议，这篇把MCP、A2A等9个协议的底层模式画清楚了，指出状态化会话是共识，去中心化发现还缺。

原文

23:51

Nathan Lambert: Interconnects@Nathan Lambert

GLM-5.2 是智谱AI推出的新模型，重点提升开放智能体场景下的表现。该模型在工具调用和多步推理任务上取得进展。GLM-5.2 在多项智能体相关基准上展现了更强的自主决策能力。

AI模型 GLM-5.2 Zhipu AI 智能体开放智能体

推荐理由：GLM-5.2 把开放智能体的能力又推了一步，想看智能体怎么进化的可以瞄一眼。

原文

21:53

21:53IT之家（博客/媒体）

Anthropic工程负责人Fiona Fung指出，工程师越依赖Claude Code等AI智能体，彼此交流越少，长期可能感到孤独。团队通过组织编程午餐、黑客松和共同开发时段来创造面对面交流机会。调查显示，Claude Code已成为创业公司使用最多的AI编程工具，部分创始人优先用它处理复杂工程任务。Fung强调，即使使用方式不同，观察他人工作也能带来收获。

行业 Claude Code Anthropic 编程助手智能体行业动态

推荐理由：Anthropic内部发现AI编程工具用多了反而让人更孤单，他们开始搞结对编程和黑客松，就是想让人少对着智能体、多跟真人交流。

原文

20:36

20:36IT之家（博客/媒体）

谷歌云与诺基亚于6月22日宣布扩展合作，将谷歌Gemini模型整合至诺基亚网络软件套件Nokia Assurance Center。双方基于Gemini开发了六个专项AI智能体，包括路由智能体、事件分类智能体、KPI选择器智能体、异常推理智能体、动作推理智能体和仪表板智能体。这些智能体帮助电信运营商降低运营成本、快速定位网络故障，并推动网络运维向全自动化演进。官方将于6月23日至25日在哥本哈根DTW Ignite大会现场演示上述智能体。

AI产品谷歌云诺基亚 Gemini 智能体电信网络运维

推荐理由：谷歌和诺基亚用Gemini做了六个电信运维智能体，能自动定位故障、推荐修复步骤，还支持自然语言生成仪表盘。运营商玩家可以看看怎么省钱提效。

原文