14:51IT之家(博客/媒体)72°阿里旗下千问App宣布向第三方Agent和Skill全面开放,所有企业可在千问运营自己的品牌Agent。首批接入企业包括瑞幸咖啡、肯德基、蜜雪冰城、东方航空等,目前正在测试中。企业可自定义Agent人设与服务边界,以对话形式提供产品服务,Agent具备记忆与主动规划能力,能在特定场景下主动提供服务,如行程提醒、复购推荐等。这标志着阿里在AI Agent生态上的重要布局,将推动更多品牌通过AI与用户互动。AI产品千问Agent阿里品牌运营智能客服推荐理由:阿里千问开放Agent生态,做品牌运营或用户服务的团队可以直接入驻,让AI帮你主动触达客户,建议关注首批接入案例。原文
10:51Weaviate@weaviate_io精选Weaviate 指出,RAG Agent 在生产环境中的成败不取决于模型,而取决于系统设计的四个基础层:安全、检索、指令和护栏。许多团队止步于演示阶段,但实际部署中会出现幻觉、输出不一致、安全漏洞等问题。可靠的 Agent 需要在这些层面进行严格设计,才能从演示变成真正可信的系统。文章提供了免费技术指南,涵盖高级 RAG 技术、工作流架构和安全实践。AI产品RAGAgent系统设计安全生产部署推荐理由:做 RAG 应用的团队别再只盯着模型了——这篇把生产环境踩坑的四个关键层讲透了,建议做 Agent 架构的开发者点开看看,能省不少试错成本。原文
01:19宝玉@doteyNous Research 发布了 Hermes Agent 的桌面客户端 Hermes Desktop,将原本的终端交互升级为图形界面。该产品在 Jensen 的 GTC 主题演讲中首次演示,现已开放公开预览。Hermes Desktop 保留了 Hermes Agent 的核心能力,同时提供更直观的 GUI 操作体验,标志着 Agent 交互方式向 GUI 主流演进。AI产品AgentGUI客户端Hermes AgentNous Research桌面应用推荐理由:Agent 从命令行走向 GUI 是降低使用门槛的关键一步,做 Agent 开发或重度使用的团队值得试试这个新客户端,看看 GUI 交互能否提升你的工作流效率。原文
01:06宝玉@doteybaoyu-image-gen Skill 新增对 Codex-cli 作为 Provider 的支持,允许用户在 Claude Code、hermes agent 等 Agent 中直接调用 Codex 生成图像,无需额外使用 Codex 客户端。该功能由社区 PR 贡献,前提是用户已安装 codex cli 并拥有订阅。这一更新简化了 Agent 内图像生成的流程,提升了开发者的使用便利性。AI产品AgentCodex-cli图像生成开源/仓库baoyu-image-gen推荐理由:对于在 Claude Code 等 Agent 中做自动化工作流的开发者,这个 Skill 省去了切换工具的麻烦,可以直接在对话中调 Codex 出图,值得一试。原文
00:09idoubi@idoubicc72°作者 idoubicc 分享了 Agent 存算分离架构的设计思路,将 Agent 运行分为本地裸机、本地沙盒和云端多副本三种模式,并重点介绍了云端场景下结合 serverless 的存算分离方案。通过将热状态、对话记录、长期记忆和工作产物分别存储在 KV、关系数据库、向量数据库和对象存储中,计算层依赖 Pod 和沙盒动态扩缩容,大幅降低运营成本。作者将 OpenClaw 托管服务迁移到 FastClaw 后,服务器从 18 台降到 3 台,成本降至原来的 1/6,同时 MRR 突破 8k 美元。AI产品Agent存算分离架构设计FastClaw云原生6 个信源在谈推荐理由:做 Agent 托管服务的团队会直接受益——存算分离架构把服务器成本砍到 1/6,利润空间瞬间打开。想规模化部署 Agent 的开发者建议仔细看,这套方案解决了多租户、长时间运行和成本控制的经典矛盾。原文
22:09berryxia@berryxiaBloome官方举办Agent模拟炒股大赛,获胜者可获数千美金奖励。用户Berryxia训练其Agent“小Berry”参与比赛,并呼吁观众投票支持。比赛设有观众投票机制,投票可帮助Agent获奖。作者强调Agent应被用于赚钱而非单纯消耗Token,展示了AI Agent在金融模拟场景中的实际应用潜力。AI产品Agent模拟炒股BloomeToken经济AI应用推荐理由:如果你还在为Agent的Token消耗发愁,这个比赛展示了Agent赚钱的可能性——做AI应用或金融模拟的开发者,值得关注这种将Agent从成本中心转为利润中心的思路。原文
10:22宝玉@dotey精选Cursor 宣布为所有 Teams 用户增加使用额度,并推出 Premium 团队席位,提供 5 倍额度仅需 3 倍成本。博主重度使用 Cursor Agent 后给出好评,认为其 multitask 模式可并行多个后台任务,速度不错;支持灵活选择多种模型,不像 Codex 和 Claude Code 受限;Plan 模式详细且稳定。不足之处包括不支持 /goal 命令、无手机版,以及缺少类似 Codex 的 Chrome use + Computer use 调试功能。整体评价在常用 GUI Agent 中排名第二,仅次于 Codex App。AI产品CursorAgentGUI Agent编程助手额度升级4 个信源在谈推荐理由:Cursor 的 Agent 模式在并行任务和模型灵活性上表现突出,做自动化开发的团队可以关注这次额度升级,性价比不错。原文
08:14岚叔@lufzzlizQwen3.7-Plus 是通义千问最新推出的多模态模型,延续了 Plus 系列的高性价比特点。该模型不仅支持屏幕读取、网页/移动端/桌面端操作,还能编写代码、调用工具和处理工作流。当前行业趋势正朝向多模态 Agent 发展,Qwen3.7-Plus 在长链路稳定性、工具调用失败恢复以及 GUI 操作权限与审计边界方面有所加强。该模型适合需要构建复杂自动化任务的开发者和团队。AI模型Qwen3.7-Plus多模态Agent工具调用性价比3 个信源在谈推荐理由:Qwen3.7-Plus 把多模态 Agent 的实用门槛又拉低了一截,做自动化工作流或 GUI 操作的开发者可以直接关注,性价比和功能覆盖都很能打。原文
11:25Justine Moore@venturetwins该Agent像创意伙伴一样,用户通过聊天讨论想法,它能自动编写提示词、调用模型并生成资产。所有资产被放置在一个画布上,Agent利用这些资产指导后续生成,形成迭代创作流程。作者提供了完整教程视频,展示了这一工具如何简化创意工作流程。AI产品智能体创意工具生成式AI工作流自动化Agent推荐理由:做创意设计或内容生成的团队,可以试试这个Agent——它把从想法到资产的流程自动化了,省去手动调参的麻烦,直接聊天就能迭代出成果。原文
21:39Viking@vikingmute本文指出同时运行多个 AI Agent 会导致人的注意力成为瓶颈,因为人类无法并行处理且上下文切换成本高,所有 Agent 的最终判断和代码合并仍需人工完成。作者将其称为“编排税”(Orchestration Tax),即启动的 Agent 越多,后续付出的成本越高。建议将任务分为简单可异步和需要深度判断两类,避免复杂任务强行并行。作者个人经验是同时运行 1-2 个任务,专注 review 和优化流程,而非盲目增加 Agent 数量。行业Agent编排税注意力瓶颈AI 编程工作流优化推荐理由:这篇文章戳中了多 Agent 工作流的核心痛点——人的注意力才是瓶颈,做 AI 编程或自动化流程的团队看完会重新评估并行策略,建议点开反思自己的编排方式。原文
15:17IT之家(博客/媒体)精选阿里云宣布开源百炼 CLI,专为 Agent 设计,支持一行命令接入 150 多款模型和十多款应用。该工具原生兼容 Claude Code、Qoder 等主流 AI Agent 框架,提供多模态模型调用、知识库检索、联网搜索、记忆管理等全套能力。开发者可通过 CLI 让 Agent 自动获取最新信息、处理本地文件、生成营销素材,或构建企业级智能助手。项目已在 GitHub 开源,降低了 Agent 开发与集成的门槛。AI产品阿里云百炼 CLIAgent开源/仓库模型调用推荐理由:百炼 CLI 解决了 Agent 开发中模型和应用集成繁琐的痛点,做 AI Agent 的开发者可以直接用一行命令接入阿里云全套能力,省去大量对接工作,建议试试。原文
10:45shao__meng@shao__meng精选Cursor 最新发布的开发者习惯报告基于全球最全面的 AI 编程数据集,揭示了 AI 如何深刻改变软件开发工作流。报告显示,开发者每周新增代码行从 2025 年初的约 3.6K 升至 2026 年 5 月的 8.6K,PR 规模显著增大,1000 行以上的大 PR 占比从 8% 升至 13.8%。Agent 单次会话的工具调用数在过去两个月上升约 30%,表明其处理更复杂任务的能力增强。AI 生成代码的留存率从约 76% 升至 81%,说明开发者更认可 AI 产出。同时,少数高水平用户获得了不成比例的巨大收益,P99 用户的 AI 代码行是中位数用户的 46 倍。AI产品CursorAI 编程开发者习惯代码产出Agent10 个信源在谈推荐理由:这份报告用数据证明了 AI 编程从辅助工具向自动化基础设施的转变,做 AI 编程工具或使用 Cursor 的开发者值得一看,能帮你理解行业趋势并调整自己的使用策略。原文
10:07berryxia@berryxia76°ZenMux 平台现已免费提供 Claude Opus 4.8 体验,用户可直接通过 API 调用。有开发者用其生成纯 Three.js 图元构建的波音 747-400 飞机,从提示词到完整可运行 HTML 页面一次成型,比例严谨、细节到位。该模型在 SWE-bench、Terminal-Bench 等多项榜单排名第一,专为 Agent 与长程编码设计,代码与多模态理解能力显著提升。ZenMux 提供零延迟首发和限时免费额度,并支持按量计费与 Builder 套餐。AI产品Claude Opus 4.8ZenMuxThree.js代码生成Agent10 个信源在谈推荐理由:Claude Opus 4.8 的复杂空间推理与工程代码能力在真实场景中得到了验证,做 3D 可视化或 Agent 开发的团队可以直接在 ZenMux 上免费试,一次成型的效果值得亲自跑一遍。原文
23:05IT之家(博客/媒体)76°腾讯混元推出 Hy-Memory,一款专为 Openclaw 等长期协作型 Agent 设计的记忆插件,旨在解决 Agent 在长期使用中的记忆碎片化、遗忘关键判断等问题。Hy-Memory 采用 6 层记忆框架、System1/System2 双系统设计和演化链机制,让 Agent 能“记得住、记得对、记得轻、更懂你”。在权威测试中,Hy-Memory 效果超过现有主流框架,记忆数量降低 70%+,信息密度提升 45%+,token 消耗降低 35%,记忆更新速度快 20%。该插件通过分层存储和异步处理,既保证了实时响应速度,又实现了深度认知迭代,让 Agent 越用越懂用户。AI产品记忆插件Agent腾讯混元Hy-Memory长期协作4 个信源在谈推荐理由:长期使用 Openclaw 的开发者常遇到“三周轨迹”困境——从蜜月期到降级使用,Hy-Memory 直接解决了这个痛点。做 Agent 应用或依赖 AI 协作的团队,建议试试这个插件,能让你的 Agent 真正成为长期记忆伙伴。原文
17:56宝玉@dotey讨论 Agent 生成结果是否需要人工审查,关键在于验证方法是否可靠以及模型能力是否足够强。对于代码生成,中间结果可减少人工检查,但初始的 Plan/Design 和最终审查仍需人工把关。有观点认为,非专业架构师的人工审查可能反而带偏项目,Agent 提供的思路可能更优。行业Agent人工审查代码生成验证方法模型能力推荐理由:做 AI Agent 开发或使用的团队,看完会重新思考人工审查的边界——不是所有环节都需要人,但关键节点不能放。原文
17:47AI Will@FinanceYF5精选Anthropic提出了“Agentic Technical Debt”概念,指出AI项目中的技术债不是线性增长,而是复利式的。每个session的健忘、每次重新推导架构导致结果不一致,三个月后代码库每块单独看合理,合在一起却像精神分裂。解药是写一份CLAUDE.md作为“项目宪法”,每次开session先读再干。行业技术债AgentCLAUDE.mdAnthropic代码管理10 个信源在谈推荐理由:做AI Agent开发的团队终于有了一个可落地的债务管理工具——CLAUDE.md能终结session间的架构混乱,建议所有用Claude写代码的人立刻试试。原文
09:49LangChain@LangChainAI精选LangChain 发布了 LangSmith Context Hub,为团队和 Agent 提供统一的上下文存储、编辑、版本管理和检索能力。该工具支持技能、AGENTS.md 文件及其他 Markdown 文件的集中管理。视频详细解释了上下文的重要性、Context Hub 的优势以及如何在 Agent 中使用它。配套的 GitHub 示例代码可供开发者直接参考。AI产品LangSmithContext HubAgent上下文管理开源/仓库推荐理由:做 Agent 开发的团队终于有了正经的上下文管理方案——Context Hub 解决了多 Agent 协作时上下文碎片化的问题,建议做 AI 应用架构的开发者点开视频看看。原文
09:16berryxia@berryxiaReplit 创始人 Michele Catasta 的愿景——让每个人都能轻松创建软件——正在成为现实。目前已有超过 5000 万用户通过自然语言在 Replit 平台上构建真实应用,且与 Claude 的合作紧密到新模型发布当天就能上线新版 Replit Agent。这标志着编程门槛彻底消失,普通人只需对话就能将想法变成可运行的网站、App 和工具。AI 不再只是取代程序员,而是让“不会写代码”的人也能成为创造者。AI产品ReplitClaudeAgent自然语言编程AI Native推荐理由:Replit + Claude 的组合正在验证 AI Native 公司的 Agent 化趋势,对想用自然语言快速验证产品想法的非技术创业者、产品经理和设计师来说,这是可以直接上手的工具,值得体验。原文
21:57Viking@vikingmuteAnySearch 是一个专为 AI Agent 设计的搜索引擎,聚合了金融、法律、学术、网络安全等专业领域的大规模数据,通过单一 API 提供结构化输出,减少 Token 浪费。它支持 API、MCP 与 Skill 接入,旨在成为 AI 时代的搜索基础设施。作者用其查询显卡性能对比,获得了丰富且具体的参考信息。AI产品搜索 APIAgent专业数据结构化输出MCP推荐理由:做 Agent 开发的团队终于有了一个专门优化过的搜索源,能直接拿到结构化专业数据,省 Token 又省心,建议接入试试。原文
18:27Harrison Chase@hwchase17LangChain 创始人 Harrison Chase 转发了 Adam Łucek 关于追踪数据重要性的观点。追踪数据记录了 Agent 的输入、输出、步骤和元数据,是分析效率瓶颈和改进方向的核心。除了用于观察行为,追踪数据还能以更复杂的方式构建稳健的评估体系。文章介绍了两种利用追踪数据为生产级 Agent 构建评估的方法。AI产品Agent追踪数据评估LangChain迭代推荐理由:做 Agent 开发的团队,追踪数据是你迭代和评估的命脉,学会用它构建评估能大幅提升 Agent 的可靠性,值得深入看看。原文
13:41岚叔@lufzzlizGrok 推出了自己的 Agent 功能,用户通过跳转授权即可使用。该 Agent 能生成图片、文本生成视频,并调用已有的全局 Skill,体验流畅。SuperGrok 和 X Premium+ 订阅者可以提前体验。安装命令已提供,使得用 Grok 生图和生视频更加简单。AI产品GrokAgent文生视频生图X Premium+推荐理由:Grok 的 Agent 让多模态创作一步到位,做内容生成的用户可以直接用,省去切换工具的麻烦,建议试试。原文
11:22LangChain@LangChainAI精选LangChain 的 Adam Łucek 分享了如何利用 Agent 运行时的 Trace 数据来构建生产级评估。Trace 数据记录了 Agent 的输入、输出、执行步骤和元数据,是优化 Agent 行为的关键。通过分析 Trace,可以识别低效环节,并用于构建更复杂的评估体系。文章介绍了两种利用 Trace 构建评估的具体方法,帮助团队快速迭代和提升 Agent 的可靠性。AI产品AgentTrace评估LangChain生产部署推荐理由:做 Agent 开发的团队终于有了可落地的评估方法论——Trace 数据不再是日志垃圾,而是构建评估的黄金矿,建议做生产级 Agent 的开发者点开看看具体怎么用。原文
11:08LangChain@LangChainAILangChain 将于 5 月 27 日在波士顿举办线下 Meetup,由团队核心成员 Sydney Runkle 与 Blitzy 的 Dillon Jones 共同主持。活动聚焦部署长运行 Agent 的挑战与运行时能力,适合对 Agent 生产化部署感兴趣的开发者。现场名额有限,需提前通过 Luma 报名。行业LangChainAgent线下活动部署实战波士顿推荐理由:想了解长运行 Agent 在生产环境落地的真实坑点?LangChain 团队和 Blitzy 的实战分享值得一听,做 Agent 部署的开发者建议报名。原文
09:35宝玉@dotey83°微软联合上海交大、复旦、同济等机构提出SkillOpt框架,将Agent Skills的优化过程自动化。该框架通过独立的优化器模型对Skill进行编辑操作,并设计harness闭环流程,只有通过验证集分数提升的修改才会被合并。实验表明,每一步设置4到8个编辑操作预算效果最佳,最终最佳Skill仅包含1到4个核心修改。该框架使GPT-5.5的直接对话准确率提升23.5%,标志着提示词工程正式进入机器学习领域。论文SkillOpt提示词工程Agent微软自动化优化推荐理由:做Agent框架或提示词工程的开发者,终于有了系统级的方法来优化Skills,不用再靠手动瞎改和调试了。建议直接看论文实验数据,特别是编辑预算的设置,对实际落地很有参考价值。原文
08:36berryxia@berryxia83°MiniMax AI工程负责人Skyler Miao预告了下一代模型M3的发布,并透露其核心架构:基于GQA的动态块稀疏注意力。该技术通过轻量索引分支快速筛选相关token块,仅对关键块执行稀疏注意力计算,大幅降低算力需求。在1M token上下文下,M3的预填充速度比M2快9.7倍,解码速度快15.6倍。这使得百万token级别的Agent任务从理论走向实用,长上下文处理变得又快又省。M3的发布将为长上下文模型赛道增添有力竞争者。AI模型MiniMaxM3长上下文稀疏注意力Agent推荐理由:MiniMax M3用动态稀疏注意力把1M上下文的算力成本打下来了,做长上下文Agent的开发者可以直接关注,这可能是让百万token任务真正落地的关键突破。原文
13:42IT之家(博客/媒体)精选OpenClaw 的龙虾之父 Peter 开源了 skill-cleaner,一个专门为 AI 技能(Skill)做体检和优化的工具。他指出,很多开发者把技能描述写得太长,导致 Agent 调用时 token 消耗大、选择噪声多、延迟高。该工具能审计技能预算、检测重复技能、筛查未使用技能、优化描述长度,帮助开发者将技能描述精简到 40 词以内,从而提升 Agent 的调用准确性和降低运行成本。Peter 强调技能描述应像路标一样简洁,而详细的逻辑应放在代码中。AI产品开源/仓库技能优化token 节省AgentCodex5 个信源在谈推荐理由:AI 技能开发者常忽略描述过长带来的 token 浪费和 Agent 选择困难,这个开源工具直接帮你审计并优化,省成本又提效果,做 Agent 或 Codex 技能的建议立刻试试。原文
12:13宝玉@dotey宝玉分享了 Codex 的两个实用功能:Steer 和 Queue。Steer 允许用户在任务执行中途打断并插入新指令,无需手动停止再继续;Queue 则用于在任务完成后排队执行后续指令。Steer 影响当前轮次,Queue 影响下一轮次,但实测 Queue 可能不会按预期执行。这两个功能能提升 Agent 任务的灵活性和效率。技巧CodexAgent任务控制SteerQueue推荐理由:做自动化任务的开发者终于可以更灵活地控制 Agent 执行流程——Steer 省去手动打断的麻烦,Queue 适合睡前挂机跑任务,值得一试。原文
11:02AI Will@FinanceYF5Anthropic 正在为 Claude 开发“文件式记忆”功能,允许用户在 Memory Files 和传统记忆之间选择。该功能会在聊天中自动整理笔记,并在相关对话时自动读取,用户也可随时查看和编辑。这被视为此前 Knowledge Bases 的升级版,旨在为未来更强的常驻 Agent 能力做准备。AI产品Claude文件式记忆Memory FilesAgent记忆管理10 个信源在谈推荐理由:Claude 用户终于有了更灵活的记忆管理方式,做长期项目或需要上下文连贯的团队可以直接用,建议关注上线时间。原文
07:57berryxia@berryxia72°Anthropic 宣布推出 Memory Files 功能,允许 Claude 在对话中自动记录关键笔记并持久化存储,用户可随时浏览和编辑这些记忆。与传统的“记住聊天记录”不同,Memory Files 将记忆变为结构化、透明且可控的文件系统,更接近 always-on Agent 的持久记忆方式。该功能旨在解决长期 Vibe Coding 项目中每次重新打开对话需重复上下文的痛点。用户可选择使用 Memory Files 或经典记忆模式。这波更新为未来 Claude Conway 等 Agent 的长期协作能力铺路。AI产品Claude记忆管理Vibe CodingAgentAnthropic10 个信源在谈推荐理由:长期用 Claude 做 Vibe Coding 的开发者终于不用每次重复上下文了——Memory Files 让记忆可编辑可审计,建议直接体验新功能。原文
17:01marktechpost@Asif Razzaq精选70°微软研究院推出Webwright,一个终端原生的浏览器Agent框架,用可复用的Playwright脚本替代点击追踪式网页自动化。该框架仅用约1000行代码和三个模块的单Agent循环,在长程任务基准Odysseys上达到60.1%,远高于基础GPT-5.4的33.5%。在Online-Mind2Web上得分86.7%,是开源测试方案中AutoEval最高分。AI模型AgentMCP/工具开源/仓库大模型GPT推荐理由:微软开源了能跑60%的Web Agent框架原文
16:37阿里云 Alibaba Cloud@alibaba_cloud5月26日,阿里云国际业务副总裁、北美区域总经理陈亮将在新加坡金沙会展中心主舞台演讲。主题为Agent Engine的规模化推理与智能体释放。该活动聚焦AI推理和Agent技术的大规模应用。行业智能体Agent大模型阿里云推荐理由:阿里云高管讲Agent规模化原文
16:36阿里云 Alibaba Cloud@alibaba_cloud5月26日,阿里云产品工程副总裁、计算平台负责人王俊华将在新加坡金沙会展中心发表主题演讲,解读 Agentic Cloud 如何赋能 Token 与智能体。该演讲聚焦云平台对 AI 代理的支持,注册链接已开放。行业阿里云Agent智能体云平台推荐理由:阿里云 VP 亲讲 Agent 云战略原文
16:02阿里云 Alibaba Cloud@alibaba_cloud阿里云CTO李飞飞将于5月26日在新加坡金沙会展中心发表主题演讲,主题为“Ship the Next”和“Scaling Trustworthy Agents”。该活动聚焦AI智能体的规模化部署与可信性挑战。李飞飞将分享阿里云在智能体领域的技术进展与实践经验。行业智能体Agent阿里云推荐理由:阿里云CTO讲智能体规模化原文
16:02阿里云 Alibaba Cloud@alibaba_cloud阿里巴巴通义大模型业务部多模态交互负责人Steven Hoi教授将于5月26日在新加坡金沙会展中心发表主题演讲,探讨Agent时代的基础模型。该演讲聚焦于基础模型如何支撑智能体应用的发展。活动面向AI从业者和研究者开放注册。行业Agent大模型多模态智能体推荐理由:阿里专家讲Agent时代基础模型原文
06:33IT之家(博客/媒体)英伟达发布 2027 财年 Q1 财报,营收 816 亿美元,同比增长 85%,数据中心业务贡献 752 亿美元。黄仁勋在电话会上预测,超大规模云厂商的 AI 资本开支将从目前的 1 万亿美元增长到 3 至 4 万亿美元,远超华尔街共识。这一预测背后,是 AI 数据中心对电力的巨大需求正在推高普通居民的电费,弗吉尼亚州居民电费已上涨近两倍。同时,黄仁勋描绘了未来数十亿 Agent 的图景,Agentic AI 计算需求暴增 1000%,英伟达下一代 Vera Rubin 平台将大幅降低推理成本。4 万亿美元基础设施投入被视为通往 AGI 的高速公路,英伟达和云巨头正在豪赌,而每个普通人都是利益相关者。行业AI 基建英伟达资本开支数据中心Agent推荐理由:黄仁勋把 AI 基建的赌注推到了 4 万亿美元,远超华尔街预期,做投资或关注 AI 产业趋势的人必须理解这个信号——它直接关系到算力成本、电费账单和未来 Agent 经济的走向。原文
19:05岚叔@lufzzliz83°阿里通义千问发布 Qwen3.7-Max,在第三方 Arena 全球大模型盲测总榜中超越 Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,位列国产第一,与 GPT、Claude、Gemini 最强模型接近。在编程智能体方面,SWE-Pro、SWE-Multilingual 等测评领先,Terminal Bench 2.0 得分 69.7。通用智能体能力显著提升,在 MCP-Atlas、MCP-Mark 等现实测试中创国产新高。新增 preserve_thinking 参数,保留前序思维内容以增强 Agent 决策一致性,减少重复推理 Token 消耗,默认关闭。实测在 Claude Code 下跨框架泛化能力不错,但需要更精准的提示词和多轮迭代。AI模型Qwen3.7-Max国产模型编程智能体AgentMCP/工具2 个信源在谈推荐理由:Qwen3.7-Max 在多项基准上追平国际顶尖模型,做 Agent 和编程自动化的开发者可以直接拿来替代闭源方案,尤其是 preserve_thinking 参数对长周期任务很有用,值得一试。原文
08:05LangChain@LangChainAI精选LangChain 发布新的流式协议,旨在解决 Agent 流式输出中工具、状态、子代理、媒体、中断和重连等复杂场景的解析难题。传统流式方案依赖原始事件流,开发者需手动解析大量日志,效率低下。新协议将 Agent 运行转化为类型化投影,应用可直接订阅,大幅降低开发复杂度。该协议特别适合需要实时渲染多模态 Agent 输出的应用场景。AI产品LangChain流式协议Agent开发者工具实时交互推荐理由:Agent 流式输出一直是个痛点,LangChain 的新协议让开发者不再需要手动解析原始事件流,做 Agent 应用或实时交互界面的团队可以直接用,省去大量底层工作。原文
21:51berryxia@berryxiaMemOS 2.0 开源项目在 GitHub 上获得 9.3K Star,其核心升级是“执行即学习”功能。不同于传统记忆方案仅记录聊天记录或使用 RAG 检索,MemOS 2.0 在 Agent 执行任务时,将整个执行过程拆解为可学习的单元,自动分层提炼为原始轨迹、通用套路、世界模型和肌肉记忆。双重反馈机制自动评分,强化有效经验,淡忘低效行为。用户反馈显示,第二天新任务时,Agent 能自动沿用前一轮磨合出的代码风格和习惯,实现真正的持续进化。支持 Hermes 和 OpenClaw 无缝迁移,一行命令安装,并提供 Memory Viewer 可视化记忆链路。AI产品MemOSAI记忆执行即学习开源/仓库Agent8 个信源在谈推荐理由:做 AI Agent 或自动化工具的开发者,MemOS 2.0 解决了记忆碎片化、无法持续学习的痛点,越用越懂你,建议直接试试一行命令迁移。原文
10:48Viking@vikingmute精选AnySearch 是一个专为 AI Agent 设计的搜索引擎,聚合了金融、法律、学术、网络安全等专业领域的大规模数据,通过单一 API 即可访问。它解决了传统搜索引擎数据盲区大、结果未针对 Agent 优化的问题,支持结构化输出以减少 Token 浪费,并原生支持 API、MCP 与 Skill 接入。用户实测在查询显卡性能对比时,能提供具体参考链接和丰富信息。AnySearch 定位为 AI 时代的搜索基础设施,为 Agent 提供高质量信息门户。AI产品搜索 APIAgentAnySearch结构化输出MCP/工具推荐理由:做 Agent 开发的团队终于有了一个真正为 AI 优化的搜索 API,不用再忍受 Google 的盲区和 Token 浪费,建议直接接入试试。原文
10:48Viking@vikingmuteAnySearch 宣布面向所有开发者免费开放体验,支持接入任意 Agent 或 AI 工作流作为搜索引擎。开发者可以将其替换掉 Agent 中的默认搜索引擎,以获得更灵活、更可控的搜索能力。该服务旨在为 AI 应用提供定制化的搜索接口,提升信息检索的准确性和效率。目前 AnySearch 已开放试用,开发者可直接通过链接体验。AI产品搜索引擎AgentAI 工作流免费AnySearch推荐理由:做 AI Agent 或工作流的开发者终于有了一个可自由替换的搜索引擎选项,建议直接替换默认搜索试试效果。原文