全部 AI 动态 · AI 热点

6月3日

14:51

14:51IT之家（博客/媒体）

72°

阿里旗下千问App宣布向第三方Agent和Skill全面开放，所有企业可在千问运营自己的品牌Agent。首批接入企业包括瑞幸咖啡、肯德基、蜜雪冰城、东方航空等，目前正在测试中。企业可自定义Agent人设与服务边界，以对话形式提供产品服务，Agent具备记忆与主动规划能力，能在特定场景下主动提供服务，如行程提醒、复购推荐等。这标志着阿里在AI Agent生态上的重要布局，将推动更多品牌通过AI与用户互动。

AI产品千问 Agent 阿里品牌运营智能客服

推荐理由：阿里千问开放Agent生态，做品牌运营或用户服务的团队可以直接入驻，让AI帮你主动触达客户，建议关注首批接入案例。

原文

10:51

Weaviate@weaviate_io

精选

Weaviate 指出，RAG Agent 在生产环境中的成败不取决于模型，而取决于系统设计的四个基础层：安全、检索、指令和护栏。许多团队止步于演示阶段，但实际部署中会出现幻觉、输出不一致、安全漏洞等问题。可靠的 Agent 需要在这些层面进行严格设计，才能从演示变成真正可信的系统。文章提供了免费技术指南，涵盖高级 RAG 技术、工作流架构和安全实践。

AI产品 RAG Agent 系统设计安全生产部署

推荐理由：做 RAG 应用的团队别再只盯着模型了——这篇把生产环境踩坑的四个关键层讲透了，建议做 Agent 架构的开发者点开看看，能省不少试错成本。

原文

01:19

宝玉@dotey

Nous Research 发布了 Hermes Agent 的桌面客户端 Hermes Desktop，将原本的终端交互升级为图形界面。该产品在 Jensen 的 GTC 主题演讲中首次演示，现已开放公开预览。Hermes Desktop 保留了 Hermes Agent 的核心能力，同时提供更直观的 GUI 操作体验，标志着 Agent 交互方式向 GUI 主流演进。

AI产品 Agent GUI客户端 Hermes Agent Nous Research 桌面应用

推荐理由：Agent 从命令行走向 GUI 是降低使用门槛的关键一步，做 Agent 开发或重度使用的团队值得试试这个新客户端，看看 GUI 交互能否提升你的工作流效率。

原文

01:06

宝玉@dotey

baoyu-image-gen Skill 新增对 Codex-cli 作为 Provider 的支持，允许用户在 Claude Code、hermes agent 等 Agent 中直接调用 Codex 生成图像，无需额外使用 Codex 客户端。该功能由社区 PR 贡献，前提是用户已安装 codex cli 并拥有订阅。这一更新简化了 Agent 内图像生成的流程，提升了开发者的使用便利性。

AI产品 Agent Codex-cli 图像生成开源/仓库 baoyu-image-gen

推荐理由：对于在 Claude Code 等 Agent 中做自动化工作流的开发者，这个 Skill 省去了切换工具的麻烦，可以直接在对话中调 Codex 出图，值得一试。

原文

00:09

idoubi@idoubicc

72°

作者 idoubicc 分享了 Agent 存算分离架构的设计思路，将 Agent 运行分为本地裸机、本地沙盒和云端多副本三种模式，并重点介绍了云端场景下结合 serverless 的存算分离方案。通过将热状态、对话记录、长期记忆和工作产物分别存储在 KV、关系数据库、向量数据库和对象存储中，计算层依赖 Pod 和沙盒动态扩缩容，大幅降低运营成本。作者将 OpenClaw 托管服务迁移到 FastClaw 后，服务器从 18 台降到 3 台，成本降至原来的 1/6，同时 MRR 突破 8k 美元。

AI产品 Agent 存算分离架构设计 FastClaw 云原生

推荐理由：做 Agent 托管服务的团队会直接受益——存算分离架构把服务器成本砍到 1/6，利润空间瞬间打开。想规模化部署 Agent 的开发者建议仔细看，这套方案解决了多租户、长时间运行和成本控制的经典矛盾。

原文

6月2日

22:09

berryxia@berryxia

Bloome官方举办Agent模拟炒股大赛，获胜者可获数千美金奖励。用户Berryxia训练其Agent“小Berry”参与比赛，并呼吁观众投票支持。比赛设有观众投票机制，投票可帮助Agent获奖。作者强调Agent应被用于赚钱而非单纯消耗Token，展示了AI Agent在金融模拟场景中的实际应用潜力。

AI产品 Agent 模拟炒股 Bloome Token经济 AI应用

推荐理由：如果你还在为Agent的Token消耗发愁，这个比赛展示了Agent赚钱的可能性——做AI应用或金融模拟的开发者，值得关注这种将Agent从成本中心转为利润中心的思路。

原文

10:22

宝玉@dotey

精选

Cursor 宣布为所有 Teams 用户增加使用额度，并推出 Premium 团队席位，提供 5 倍额度仅需 3 倍成本。博主重度使用 Cursor Agent 后给出好评，认为其 multitask 模式可并行多个后台任务，速度不错；支持灵活选择多种模型，不像 Codex 和 Claude Code 受限；Plan 模式详细且稳定。不足之处包括不支持 /goal 命令、无手机版，以及缺少类似 Codex 的 Chrome use + Computer use 调试功能。整体评价在常用 GUI Agent 中排名第二，仅次于 Codex App。

AI产品 Cursor Agent GUI Agent 编程助手额度升级

推荐理由：Cursor 的 Agent 模式在并行任务和模型灵活性上表现突出，做自动化开发的团队可以关注这次额度升级，性价比不错。

原文

08:14

岚叔@lufzzliz

AI模型 Qwen3.7-Plus 多模态 Agent 工具调用性价比

推荐理由：Qwen3.7-Plus 把多模态 Agent 的实用门槛又拉低了一截，做自动化工作流或 GUI 操作的开发者可以直接关注，性价比和功能覆盖都很能打。

原文

5月30日

11:25

Justine Moore@venturetwins

该Agent像创意伙伴一样，用户通过聊天讨论想法，它能自动编写提示词、调用模型并生成资产。所有资产被放置在一个画布上，Agent利用这些资产指导后续生成，形成迭代创作流程。作者提供了完整教程视频，展示了这一工具如何简化创意工作流程。

AI产品智能体创意工具生成式AI 工作流自动化 Agent

推荐理由：做创意设计或内容生成的团队，可以试试这个Agent——它把从想法到资产的流程自动化了，省去手动调参的麻烦，直接聊天就能迭代出成果。

原文

5月29日

21:39

Viking@vikingmute

本文指出同时运行多个 AI Agent 会导致人的注意力成为瓶颈，因为人类无法并行处理且上下文切换成本高，所有 Agent 的最终判断和代码合并仍需人工完成。作者将其称为“编排税”（Orchestration Tax），即启动的 Agent 越多，后续付出的成本越高。建议将任务分为简单可异步和需要深度判断两类，避免复杂任务强行并行。作者个人经验是同时运行 1-2 个任务，专注 review 和优化流程，而非盲目增加 Agent 数量。

行业 Agent 编排税注意力瓶颈 AI 编程工作流优化

推荐理由：这篇文章戳中了多 Agent 工作流的核心痛点——人的注意力才是瓶颈，做 AI 编程或自动化流程的团队看完会重新评估并行策略，建议点开反思自己的编排方式。

原文

15:17

15:17IT之家（博客/媒体）

精选

阿里云宣布开源百炼 CLI，专为 Agent 设计，支持一行命令接入 150 多款模型和十多款应用。该工具原生兼容 Claude Code、Qoder 等主流 AI Agent 框架，提供多模态模型调用、知识库检索、联网搜索、记忆管理等全套能力。开发者可通过 CLI 让 Agent 自动获取最新信息、处理本地文件、生成营销素材，或构建企业级智能助手。项目已在 GitHub 开源，降低了 Agent 开发与集成的门槛。

AI产品阿里云百炼 CLI Agent 开源/仓库模型调用

推荐理由：百炼 CLI 解决了 Agent 开发中模型和应用集成繁琐的痛点，做 AI Agent 的开发者可以直接用一行命令接入阿里云全套能力，省去大量对接工作，建议试试。

原文

10:45

shao__meng@shao__meng

精选

AI产品 Cursor AI 编程开发者习惯代码产出 Agent

推荐理由：这份报告用数据证明了 AI 编程从辅助工具向自动化基础设施的转变，做 AI 编程工具或使用 Cursor 的开发者值得一看，能帮你理解行业趋势并调整自己的使用策略。

原文

10:07

berryxia@berryxia

76°

ZenMux 平台现已免费提供 Claude Opus 4.8 体验，用户可直接通过 API 调用。有开发者用其生成纯 Three.js 图元构建的波音 747-400 飞机，从提示词到完整可运行 HTML 页面一次成型，比例严谨、细节到位。该模型在 SWE-bench、Terminal-Bench 等多项榜单排名第一，专为 Agent 与长程编码设计，代码与多模态理解能力显著提升。ZenMux 提供零延迟首发和限时免费额度，并支持按量计费与 Builder 套餐。

AI产品 Claude Opus 4.8 ZenMux Three.js 代码生成 Agent

推荐理由：Claude Opus 4.8 的复杂空间推理与工程代码能力在真实场景中得到了验证，做 3D 可视化或 Agent 开发的团队可以直接在 ZenMux 上免费试，一次成型的效果值得亲自跑一遍。

原文

5月28日

23:05

23:05IT之家（博客/媒体）

76°

腾讯混元推出 Hy-Memory，一款专为 Openclaw 等长期协作型 Agent 设计的记忆插件，旨在解决 Agent 在长期使用中的记忆碎片化、遗忘关键判断等问题。Hy-Memory 采用 6 层记忆框架、System1/System2 双系统设计和演化链机制，让 Agent 能“记得住、记得对、记得轻、更懂你”。在权威测试中，Hy-Memory 效果超过现有主流框架，记忆数量降低 70%+，信息密度提升 45%+，token 消耗降低 35%，记忆更新速度快 20%。该插件通过分层存储和异步处理，既保证了实时响应速度，又实现了深度认知迭代，让 Agent 越用越懂用户。

AI产品记忆插件 Agent 腾讯混元 Hy-Memory 长期协作

推荐理由：长期使用 Openclaw 的开发者常遇到“三周轨迹”困境——从蜜月期到降级使用，Hy-Memory 直接解决了这个痛点。做 Agent 应用或依赖 AI 协作的团队，建议试试这个插件，能让你的 Agent 真正成为长期记忆伙伴。

原文

17:56

宝玉@dotey

讨论 Agent 生成结果是否需要人工审查，关键在于验证方法是否可靠以及模型能力是否足够强。对于代码生成，中间结果可减少人工检查，但初始的 Plan/Design 和最终审查仍需人工把关。有观点认为，非专业架构师的人工审查可能反而带偏项目，Agent 提供的思路可能更优。

行业 Agent 人工审查代码生成验证方法模型能力

推荐理由：做 AI Agent 开发或使用的团队，看完会重新思考人工审查的边界——不是所有环节都需要人，但关键节点不能放。

原文

17:47

AI Will@FinanceYF5

精选

Anthropic提出了“Agentic Technical Debt”概念，指出AI项目中的技术债不是线性增长，而是复利式的。每个session的健忘、每次重新推导架构导致结果不一致，三个月后代码库每块单独看合理，合在一起却像精神分裂。解药是写一份CLAUDE.md作为“项目宪法”，每次开session先读再干。

行业技术债 Agent CLAUDE.md Anthropic 代码管理

推荐理由：做AI Agent开发的团队终于有了一个可落地的债务管理工具——CLAUDE.md能终结session间的架构混乱，建议所有用Claude写代码的人立刻试试。

原文

09:49

LangChain@LangChainAI

精选

LangChain 发布了 LangSmith Context Hub，为团队和 Agent 提供统一的上下文存储、编辑、版本管理和检索能力。该工具支持技能、AGENTS.md 文件及其他 Markdown 文件的集中管理。视频详细解释了上下文的重要性、Context Hub 的优势以及如何在 Agent 中使用它。配套的 GitHub 示例代码可供开发者直接参考。

AI产品 LangSmith Context Hub Agent 上下文管理开源/仓库

推荐理由：做 Agent 开发的团队终于有了正经的上下文管理方案——Context Hub 解决了多 Agent 协作时上下文碎片化的问题，建议做 AI 应用架构的开发者点开视频看看。

原文

09:16

berryxia@berryxia

Replit 创始人 Michele Catasta 的愿景——让每个人都能轻松创建软件——正在成为现实。目前已有超过 5000 万用户通过自然语言在 Replit 平台上构建真实应用，且与 Claude 的合作紧密到新模型发布当天就能上线新版 Replit Agent。这标志着编程门槛彻底消失，普通人只需对话就能将想法变成可运行的网站、App 和工具。AI 不再只是取代程序员，而是让“不会写代码”的人也能成为创造者。

AI产品 Replit Claude Agent 自然语言编程 AI Native

推荐理由：Replit + Claude 的组合正在验证 AI Native 公司的 Agent 化趋势，对想用自然语言快速验证产品想法的非技术创业者、产品经理和设计师来说，这是可以直接上手的工具，值得体验。

原文

5月27日

21:57

Viking@vikingmute

AnySearch 是一个专为 AI Agent 设计的搜索引擎，聚合了金融、法律、学术、网络安全等专业领域的大规模数据，通过单一 API 提供结构化输出，减少 Token 浪费。它支持 API、MCP 与 Skill 接入，旨在成为 AI 时代的搜索基础设施。作者用其查询显卡性能对比，获得了丰富且具体的参考信息。

AI产品搜索 API Agent 专业数据结构化输出 MCP

推荐理由：做 Agent 开发的团队终于有了一个专门优化过的搜索源，能直接拿到结构化专业数据，省 Token 又省心，建议接入试试。

原文

18:27

Harrison Chase@hwchase17

LangChain 创始人 Harrison Chase 转发了 Adam Łucek 关于追踪数据重要性的观点。追踪数据记录了 Agent 的输入、输出、步骤和元数据，是分析效率瓶颈和改进方向的核心。除了用于观察行为，追踪数据还能以更复杂的方式构建稳健的评估体系。文章介绍了两种利用追踪数据为生产级 Agent 构建评估的方法。

AI产品 Agent 追踪数据评估 LangChain 迭代

推荐理由：做 Agent 开发的团队，追踪数据是你迭代和评估的命脉，学会用它构建评估能大幅提升 Agent 的可靠性，值得深入看看。

原文

13:41

岚叔@lufzzliz

Grok 推出了自己的 Agent 功能，用户通过跳转授权即可使用。该 Agent 能生成图片、文本生成视频，并调用已有的全局 Skill，体验流畅。SuperGrok 和 X Premium+ 订阅者可以提前体验。安装命令已提供，使得用 Grok 生图和生视频更加简单。

AI产品 Grok Agent 文生视频生图 X Premium+

推荐理由：Grok 的 Agent 让多模态创作一步到位，做内容生成的用户可以直接用，省去切换工具的麻烦，建议试试。

原文

11:22

LangChain@LangChainAI

精选

LangChain 的 Adam Łucek 分享了如何利用 Agent 运行时的 Trace 数据来构建生产级评估。Trace 数据记录了 Agent 的输入、输出、执行步骤和元数据，是优化 Agent 行为的关键。通过分析 Trace，可以识别低效环节，并用于构建更复杂的评估体系。文章介绍了两种利用 Trace 构建评估的具体方法，帮助团队快速迭代和提升 Agent 的可靠性。

AI产品 Agent Trace 评估 LangChain 生产部署

推荐理由：做 Agent 开发的团队终于有了可落地的评估方法论——Trace 数据不再是日志垃圾，而是构建评估的黄金矿，建议做生产级 Agent 的开发者点开看看具体怎么用。

原文

11:08

LangChain@LangChainAI

LangChain 将于 5 月 27 日在波士顿举办线下 Meetup，由团队核心成员 Sydney Runkle 与 Blitzy 的 Dillon Jones 共同主持。活动聚焦部署长运行 Agent 的挑战与运行时能力，适合对 Agent 生产化部署感兴趣的开发者。现场名额有限，需提前通过 Luma 报名。

行业 LangChain Agent 线下活动部署实战波士顿

推荐理由：想了解长运行 Agent 在生产环境落地的真实坑点？LangChain 团队和 Blitzy 的实战分享值得一听，做 Agent 部署的开发者建议报名。

原文

09:35

宝玉@dotey

83°

微软联合上海交大、复旦、同济等机构提出SkillOpt框架，将Agent Skills的优化过程自动化。该框架通过独立的优化器模型对Skill进行编辑操作，并设计harness闭环流程，只有通过验证集分数提升的修改才会被合并。实验表明，每一步设置4到8个编辑操作预算效果最佳，最终最佳Skill仅包含1到4个核心修改。该框架使GPT-5.5的直接对话准确率提升23.5%，标志着提示词工程正式进入机器学习领域。

论文 SkillOpt 提示词工程 Agent 微软自动化优化

推荐理由：做Agent框架或提示词工程的开发者，终于有了系统级的方法来优化Skills，不用再靠手动瞎改和调试了。建议直接看论文实验数据，特别是编辑预算的设置，对实际落地很有参考价值。

原文

08:36

berryxia@berryxia

83°

MiniMax AI工程负责人Skyler Miao预告了下一代模型M3的发布，并透露其核心架构：基于GQA的动态块稀疏注意力。该技术通过轻量索引分支快速筛选相关token块，仅对关键块执行稀疏注意力计算，大幅降低算力需求。在1M token上下文下，M3的预填充速度比M2快9.7倍，解码速度快15.6倍。这使得百万token级别的Agent任务从理论走向实用，长上下文处理变得又快又省。M3的发布将为长上下文模型赛道增添有力竞争者。

AI模型 MiniMax M3 长上下文稀疏注意力 Agent

推荐理由：MiniMax M3用动态稀疏注意力把1M上下文的算力成本打下来了，做长上下文Agent的开发者可以直接关注，这可能是让百万token任务真正落地的关键突破。

原文

5月26日

13:42

13:42IT之家（博客/媒体）

精选

OpenClaw 的龙虾之父 Peter 开源了 skill-cleaner，一个专门为 AI 技能（Skill）做体检和优化的工具。他指出，很多开发者把技能描述写得太长，导致 Agent 调用时 token 消耗大、选择噪声多、延迟高。该工具能审计技能预算、检测重复技能、筛查未使用技能、优化描述长度，帮助开发者将技能描述精简到 40 词以内，从而提升 Agent 的调用准确性和降低运行成本。Peter 强调技能描述应像路标一样简洁，而详细的逻辑应放在代码中。

AI产品开源/仓库技能优化 token 节省 Agent Codex

推荐理由：AI 技能开发者常忽略描述过长带来的 token 浪费和 Agent 选择困难，这个开源工具直接帮你审计并优化，省成本又提效果，做 Agent 或 Codex 技能的建议立刻试试。

原文

5月25日

12:13

宝玉@dotey

宝玉分享了 Codex 的两个实用功能：Steer 和 Queue。Steer 允许用户在任务执行中途打断并插入新指令，无需手动停止再继续；Queue 则用于在任务完成后排队执行后续指令。Steer 影响当前轮次，Queue 影响下一轮次，但实测 Queue 可能不会按预期执行。这两个功能能提升 Agent 任务的灵活性和效率。

技巧 Codex Agent 任务控制 Steer Queue

推荐理由：做自动化任务的开发者终于可以更灵活地控制 Agent 执行流程——Steer 省去手动打断的麻烦，Queue 适合睡前挂机跑任务，值得一试。

原文

11:02

AI Will@FinanceYF5

Anthropic 正在为 Claude 开发“文件式记忆”功能，允许用户在 Memory Files 和传统记忆之间选择。该功能会在聊天中自动整理笔记，并在相关对话时自动读取，用户也可随时查看和编辑。这被视为此前 Knowledge Bases 的升级版，旨在为未来更强的常驻 Agent 能力做准备。

AI产品 Claude 文件式记忆 Memory Files Agent 记忆管理

推荐理由：Claude 用户终于有了更灵活的记忆管理方式，做长期项目或需要上下文连贯的团队可以直接用，建议关注上线时间。

原文

07:57

berryxia@berryxia

72°

Anthropic 宣布推出 Memory Files 功能，允许 Claude 在对话中自动记录关键笔记并持久化存储，用户可随时浏览和编辑这些记忆。与传统的“记住聊天记录”不同，Memory Files 将记忆变为结构化、透明且可控的文件系统，更接近 always-on Agent 的持久记忆方式。该功能旨在解决长期 Vibe Coding 项目中每次重新打开对话需重复上下文的痛点。用户可选择使用 Memory Files 或经典记忆模式。这波更新为未来 Claude Conway 等 Agent 的长期协作能力铺路。

AI产品 Claude 记忆管理 Vibe Coding Agent Anthropic

推荐理由：长期用 Claude 做 Vibe Coding 的开发者终于不用每次重复上下文了——Memory Files 让记忆可编辑可审计，建议直接体验新功能。

原文

5月24日

17:01

marktechpost@Asif Razzaq

精选70°

微软研究院推出Webwright，一个终端原生的浏览器Agent框架，用可复用的Playwright脚本替代点击追踪式网页自动化。该框架仅用约1000行代码和三个模块的单Agent循环，在长程任务基准Odysseys上达到60.1%，远高于基础GPT-5.4的33.5%。在Online-Mind2Web上得分86.7%，是开源测试方案中AutoEval最高分。

AI模型 Agent MCP/工具开源/仓库大模型 GPT

推荐理由：微软开源了能跑60%的Web Agent框架

原文

16:37

阿里云 Alibaba Cloud@alibaba_cloud

5月26日，阿里云国际业务副总裁、北美区域总经理陈亮将在新加坡金沙会展中心主舞台演讲。主题为Agent Engine的规模化推理与智能体释放。该活动聚焦AI推理和Agent技术的大规模应用。

行业智能体 Agent 大模型阿里云

推荐理由：阿里云高管讲Agent规模化

原文

16:36

阿里云 Alibaba Cloud@alibaba_cloud

5月26日，阿里云产品工程副总裁、计算平台负责人王俊华将在新加坡金沙会展中心发表主题演讲，解读 Agentic Cloud 如何赋能 Token 与智能体。该演讲聚焦云平台对 AI 代理的支持，注册链接已开放。

行业阿里云 Agent 智能体云平台

推荐理由：阿里云 VP 亲讲 Agent 云战略

原文

16:02

阿里云 Alibaba Cloud@alibaba_cloud

阿里云CTO李飞飞将于5月26日在新加坡金沙会展中心发表主题演讲，主题为“Ship the Next”和“Scaling Trustworthy Agents”。该活动聚焦AI智能体的规模化部署与可信性挑战。李飞飞将分享阿里云在智能体领域的技术进展与实践经验。

行业智能体 Agent 阿里云

推荐理由：阿里云CTO讲智能体规模化

原文

16:02

阿里云 Alibaba Cloud@alibaba_cloud

阿里巴巴通义大模型业务部多模态交互负责人Steven Hoi教授将于5月26日在新加坡金沙会展中心发表主题演讲，探讨Agent时代的基础模型。该演讲聚焦于基础模型如何支撑智能体应用的发展。活动面向AI从业者和研究者开放注册。

行业 Agent 大模型多模态智能体

推荐理由：阿里专家讲Agent时代基础模型

原文

5月23日

06:33

06:33IT之家（博客/媒体）

英伟达发布 2027 财年 Q1 财报，营收 816 亿美元，同比增长 85%，数据中心业务贡献 752 亿美元。黄仁勋在电话会上预测，超大规模云厂商的 AI 资本开支将从目前的 1 万亿美元增长到 3 至 4 万亿美元，远超华尔街共识。这一预测背后，是 AI 数据中心对电力的巨大需求正在推高普通居民的电费，弗吉尼亚州居民电费已上涨近两倍。同时，黄仁勋描绘了未来数十亿 Agent 的图景，Agentic AI 计算需求暴增 1000%，英伟达下一代 Vera Rubin 平台将大幅降低推理成本。4 万亿美元基础设施投入被视为通往 AGI 的高速公路，英伟达和云巨头正在豪赌，而每个普通人都是利益相关者。

行业 AI 基建英伟达资本开支数据中心 Agent

推荐理由：黄仁勋把 AI 基建的赌注推到了 4 万亿美元，远超华尔街预期，做投资或关注 AI 产业趋势的人必须理解这个信号——它直接关系到算力成本、电费账单和未来 Agent 经济的走向。

原文

5月22日

19:05

岚叔@lufzzliz

83°

阿里通义千问发布 Qwen3.7-Max，在第三方 Arena 全球大模型盲测总榜中超越 Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1，位列国产第一，与 GPT、Claude、Gemini 最强模型接近。在编程智能体方面，SWE-Pro、SWE-Multilingual 等测评领先，Terminal Bench 2.0 得分 69.7。通用智能体能力显著提升，在 MCP-Atlas、MCP-Mark 等现实测试中创国产新高。新增 preserve_thinking 参数，保留前序思维内容以增强 Agent 决策一致性，减少重复推理 Token 消耗，默认关闭。实测在 Claude Code 下跨框架泛化能力不错，但需要更精准的提示词和多轮迭代。

AI模型 Qwen3.7-Max 国产模型编程智能体 Agent MCP/工具

推荐理由：Qwen3.7-Max 在多项基准上追平国际顶尖模型，做 Agent 和编程自动化的开发者可以直接拿来替代闭源方案，尤其是 preserve_thinking 参数对长周期任务很有用，值得一试。

原文

08:05

LangChain@LangChainAI

精选

LangChain 发布新的流式协议，旨在解决 Agent 流式输出中工具、状态、子代理、媒体、中断和重连等复杂场景的解析难题。传统流式方案依赖原始事件流，开发者需手动解析大量日志，效率低下。新协议将 Agent 运行转化为类型化投影，应用可直接订阅，大幅降低开发复杂度。该协议特别适合需要实时渲染多模态 Agent 输出的应用场景。

AI产品 LangChain 流式协议 Agent 开发者工具实时交互

推荐理由：Agent 流式输出一直是个痛点，LangChain 的新协议让开发者不再需要手动解析原始事件流，做 Agent 应用或实时交互界面的团队可以直接用，省去大量底层工作。

原文

5月21日

21:51

berryxia@berryxia

MemOS 2.0 开源项目在 GitHub 上获得 9.3K Star，其核心升级是“执行即学习”功能。不同于传统记忆方案仅记录聊天记录或使用 RAG 检索，MemOS 2.0 在 Agent 执行任务时，将整个执行过程拆解为可学习的单元，自动分层提炼为原始轨迹、通用套路、世界模型和肌肉记忆。双重反馈机制自动评分，强化有效经验，淡忘低效行为。用户反馈显示，第二天新任务时，Agent 能自动沿用前一轮磨合出的代码风格和习惯，实现真正的持续进化。支持 Hermes 和 OpenClaw 无缝迁移，一行命令安装，并提供 Memory Viewer 可视化记忆链路。

AI产品 MemOS AI记忆执行即学习开源/仓库 Agent

推荐理由：做 AI Agent 或自动化工具的开发者，MemOS 2.0 解决了记忆碎片化、无法持续学习的痛点，越用越懂你，建议直接试试一行命令迁移。

原文

10:48

Viking@vikingmute

精选

AnySearch 是一个专为 AI Agent 设计的搜索引擎，聚合了金融、法律、学术、网络安全等专业领域的大规模数据，通过单一 API 即可访问。它解决了传统搜索引擎数据盲区大、结果未针对 Agent 优化的问题，支持结构化输出以减少 Token 浪费，并原生支持 API、MCP 与 Skill 接入。用户实测在查询显卡性能对比时，能提供具体参考链接和丰富信息。AnySearch 定位为 AI 时代的搜索基础设施，为 Agent 提供高质量信息门户。

AI产品搜索 API Agent AnySearch 结构化输出 MCP/工具

推荐理由：做 Agent 开发的团队终于有了一个真正为 AI 优化的搜索 API，不用再忍受 Google 的盲区和 Token 浪费，建议直接接入试试。

原文

10:48

Viking@vikingmute

AnySearch 宣布面向所有开发者免费开放体验，支持接入任意 Agent 或 AI 工作流作为搜索引擎。开发者可以将其替换掉 Agent 中的默认搜索引擎，以获得更灵活、更可控的搜索能力。该服务旨在为 AI 应用提供定制化的搜索接口，提升信息检索的准确性和效率。目前 AnySearch 已开放试用，开发者可直接通过链接体验。

AI产品搜索引擎 Agent AI 工作流免费 AnySearch

推荐理由：做 AI Agent 或工作流的开发者终于有了一个可自由替换的搜索引擎选项，建议直接替换默认搜索试试效果。

原文