全部 AI 动态 · AI 热点

5月28日

21:50

21:50IT之家（博客/媒体）

比亚迪在“敢为”智能化战略发布会上推出超级智能体“迪迪虾”，旨在将汽车从功能型工具升级为具备主动服务能力的智能体。该系统基于整车智能体系，具备全仓记忆、跨域互动、端云协同和快慢思考能力，能通过自然语言对话理解用户偏好、模糊表达并主动执行任务。现场演示显示，迪迪虾可自动调节空调、识别儿童入睡开启安静模式、提醒手机遗落，还能拆解复杂导航需求（如前往机场、找停车场、补能、订酒店）。此外，它支持多语言和方言，接入了订餐、外卖、电影推荐等生活服务，并构建了面向AI Agent的开放平台生态。

AI产品智能体比亚迪迪迪虾车载AI 主动服务

推荐理由：比亚迪把车机从被动语音助手升级成主动服务的智能体，解决了传统车载交互不够智能、不够贴心的痛点，车主和汽车智能化开发者值得关注，直接体验“一语直达”的便利。

原文

17:52

17:52IT之家（博客/媒体）

小米招聘Agent正式上线官网，基于Xiaomi MiMo大模型，为求职者提供政策解答、职位智能推荐和招聘进展查询等服务。求职者可直接询问校招流程、应届生定义、培养体系等问题，Agent会清晰同步信息。上传简历后，Agent自动解析教育背景、项目经历和技能栈，精准推荐匹配岗位，并支持查询投递进展和面试流程。该Agent旨在提升求职效率，减少焦虑等待。

AI产品智能体招聘小米 MiMo大模型求职

推荐理由：求职者终于有了AI助手来搞定招聘流程——小米招聘Agent直接解答政策、推荐岗位、查进度，省去手动搜索和等待的烦恼。正在找工作的应届生或社招人士，建议去官网试试，能节省不少时间。

原文

11:08

11:08IT之家（博客/媒体）

科技媒体 Tom's Hardware 报道，微软、Uber 等公司重新审视 AI 使用成本，发现 Token 消耗暴涨并未带来预期功能提升。高盛报告预测，到 2030 年智能体 AI 将使 Token 消费增长 24 倍，但 Uber 首席技术官表示公司数月内花完 2026 年 AI 预算，却未换来对用户有用的功能。Uber 超 80% 工程师使用智能体 AI，60% 代码由 AI 生成，但管理层质疑投入价值。微软已削减 Claude Code 订阅，转向内部 Copilot CLI，并调整计费方式，可能为压缩开支。

行业 AI 成本 Token 消耗智能体微软 Uber

推荐理由：Token 烧钱但不出活，这是所有重度依赖 AI 的团队都会面临的现实问题——做 AI 应用或管理 AI 预算的决策者，建议看看 Uber 和微软的踩坑经验，避免重蹈覆辙。

原文

04:06

04:06OpenAI Blog（博客/媒体）

Warp 宣布与 OpenAI 深度合作，在其终端中集成 GPT-5.5 等模型，用于协调本地、云端和开源开发工作流中的编程智能体。这一举措旨在解决多环境协作中智能体调度和上下文管理的痛点，让开发者能更高效地利用 AI 辅助编程。Warp 的开源策略意味着更多开发者可以参与定制和扩展，可能改变终端 AI 助手的生态格局。

AI产品编程助手智能体 GPT-5.5 开源/仓库 Warp

推荐理由：Warp 用 GPT-5.5 打通了本地与云端的编程智能体协作，做跨环境开发的团队可以直接体验更流畅的 AI 辅助工作流，值得关注。

原文

02:42

02:42Hugging Face: Blog（博客/媒体）

IBM与Artificial Analysis联合推出ITBench-AA，这是首个针对企业IT运维场景的智能体基准测试。测试涵盖事件响应、故障排查等真实任务，结果显示包括GPT-4、Claude在内的前沿模型平均得分低于50%。该基准揭示了当前AI智能体在处理复杂企业IT流程时的能力短板，为行业提供了可量化的评估标准。

AI模型智能体企业IT 基准测试 IBM 运维自动化

推荐理由：企业IT团队终于有了衡量AI智能体真实能力的标尺——前沿模型都不到50分，说明自动化运维还有很大提升空间，做IT运维或AI落地的建议点开看看差距在哪。

原文

5月27日

22:09

22:09OpenAI Blog（博客/媒体）

OpenAI 与 Thrive、Crete 合作，利用 Codex 构建了一个能自我改进的税务智能体。该智能体可自动完成税务申报、提升准确性并加速工作流程。通过持续学习和反馈机制，它能在处理税务数据时不断优化自身表现，减少人工干预。这一成果展示了 AI 在专业财务领域的应用潜力，尤其适合需要处理复杂税务规则的团队。

AI产品智能体 Codex 税务自动化工作流优化 OpenAI

推荐理由：税务团队终于有了实用的 AI 工具——Codex 驱动的智能体能自动申报并自我优化，做财务或税务自动化的开发者可以直接参考这个案例。

原文

11:06

11:06Simon Willison’s Weblog（博客/媒体）

76°

微软的 Copilot Cowork 产品存在安全漏洞，允许攻击者通过提示注入实现数据外泄。该漏洞利用代理发送包含外部图片的邮件，当用户打开邮件时，图片会触发网络请求，从而泄露数据。由于 OneDrive 可生成预认证下载链接，攻击者能通过提示注入获取这些链接并下载文件。这凸显了智能体系统在防止数据泄露方面的持续挑战。

AI产品 Microsoft 安全漏洞提示注入数据泄露智能体

推荐理由：这个漏洞揭示了智能体系统设计中的核心安全痛点，使用 Microsoft Copilot 的团队需要立即关注并评估风险，建议检查相关配置并限制代理的邮件发送权限。

原文

10:54

Pandaily@contact@pandaily.com (Pandaily)

精选

高通宣布与字节跳动达成AI芯片供应协议，将向字节跳动数据中心提供数百万颗ASIC芯片，专门用于支持AI智能体工作负载。此举标志着高通正从移动芯片领域向云基础设施多元化拓展。该合作预计于2026年5月开始交付，将帮助字节跳动提升其AI服务的计算能力。

行业高通字节跳动 AI芯片数据中心智能体

推荐理由：高通首次大规模进入数据中心AI芯片市场，字节跳动作为头部AI应用公司，其智能体场景对算力需求巨大。做AI基础设施或智能体部署的团队值得关注这一合作对芯片供应链和成本的影响。

原文

5月26日

14:48

14:48IT之家（博客/媒体）

76°

支付宝宣布其AI支付已完成3亿笔交易，支持95%的通用智能体框架，成为全球首个大规模商用的AI原生支付基建。同时，支付宝发布了全球首个面向个人的AI钱包和Token Pay服务，构建了从授权到结算的全栈AI原生支付体系。AI钱包允许用户管理智能体授权和支付任务，Token Pay则帮助大模型公司解决全球用户订阅和充值需求。MiniMax、阶跃星辰等已与支付宝合作，采用其定制化AI支付方案。此举标志着支付宝继快捷支付和扫码支付后，再次以AI支付助力AI时代商业生态。

AI产品 AI支付 AI钱包 Token Pay 智能体支付宝

推荐理由：支付宝的AI支付体系解决了智能体时代支付与授权管理的痛点，做AI应用或智能体开发的团队可以直接接入，省去自建支付基建的麻烦。

原文

5月25日

17:57

Decoder@Matthias Bastian

精选

著名程序员 George Hotz 在测试 AI 编程智能体六个月后发出警告，认为它们将成为软件开发行业最昂贵的错误之一。他指出，LLM 能快速生成原型，但在细节上漏洞百出，产生的错误越来越难以发现。这一观点反映了 AI 社区在 LLM 角色问题上存在的深刻分歧。Hotz 的批评提醒开发者，在依赖 AI 编程工具时需谨慎评估其长期影响。

行业 AI 编程智能体 LLM 软件开发 George Hotz

推荐理由：Hotz 的警告戳中了 AI 编程工具的痛点——快速原型掩盖了难以调试的细节错误，做软件开发的团队在引入 AI 智能体前值得认真读一读。

原文

17:48

marktechpost@Asif Razzaq

精选

WorkOS 推出了 auth.md，一个基于 OAuth 标准的开放智能体注册协议。该协议通过让应用在其域名下发布一个 Markdown 文件，向 AI 智能体说明支持的注册流程、请求的权限范围以及如何获取与真实用户绑定的凭证，从而无需人工填写表单。这解决了当前大多数 Web 应用缺乏结构化智能体注册方式的问题，为智能体与服务的自动化交互提供了标准化方案。

AI产品智能体 OAuth 注册协议 WorkOS 标准化

推荐理由：auth.md 为 AI 智能体与 Web 服务的自动化注册提供了标准化方案，解决了当前智能体无法自主注册的痛点。做智能体开发或 API 集成的团队可以直接参考此协议，简化注册流程。

原文

5月24日

16:43

16:43IT之家（博客/媒体）

微软要求员工改用自研Copilot CLI而非Claude Code，因后者使用成本随用户增多而攀升。其他企业也在缩减AI工具使用规模，智能体词元消耗量可达普通大语言模型查询的上千倍。OpenClaw创始人称其团队单月词元使用成本超130万美元（约885.6万元人民币）。词元单价下降但使用量上涨，体现杰文斯悖论，AI开销已高于人力成本且效率提升有限。

行业大模型 AI成本智能体微软 Claude

推荐理由：AI成本比人力还高，企业别盲目推

原文

16:25

Decoder@Jonathan Kemper

精选75°

来自马里兰大学、Google、Meta等机构的研究者使用AutoTTS框架，让Claude Code自主发现AI推理控制算法。该算法相比标准自一致性方法，在保持相同准确率的同时，计算量减少约70%。整个搜索过程仅花费40美元，耗时160分钟。

论文智能体推理模型大模型 AutoTTS Claude Code

推荐理由：AI自己设计算法，省钱又高效

原文

15:46

15:46IT之家（博客/媒体）

精选

中国科学院大连化学物理研究所与沈阳自动化研究所联合研制出智能透射电子显微镜“原眼一号”，实现“传样—成像—解析”全流程自主运行。该设备在催化剂分析中单日可处理200个样品，采集5000张图像，定量解析50万个颗粒。相比现有设备，图像获取速度提升约56倍，分析效率达人工的约300倍。两周数据量相当于传统电镜一年工作量。

AI产品智能体大模型原眼一号透射电镜

推荐理由：国产电镜效率提升300倍

原文

14:46

14:46IT之家（博客/媒体）

第56届IEEE国际电路与系统研讨会（ISCAS 2026）于5月24日在上海国际会议中心开幕，会期至5月27日。会议主题为“面向智能社会的电路与系统”，涵盖人工智能、汽车智能系统、脑科学等前沿方向。华为董事何庭波和中国科大潘建伟院士将发表演讲，分享量子信息领域成果。本届ISCAS首次获得中国计算机学会（CCF）B类会议认定，选址上海凸显中国在该领域影响力。

行业大模型 AI安全智能体集成电路

推荐理由：ISCAS 2026在上海，何庭波潘建伟都来了

原文

10:52

marktechpost@Sana Hassan

精选

本文介绍了如何基于 Anthropic API 构建 SuperClaude 框架的高级工作流，通过集成命令系统、多智能体协作、模式切换和会话记忆功能，实现更复杂、更可控的 AI 交互。该框架允许开发者定义自定义命令、创建专用智能体角色、切换不同工作模式，并利用会话记忆保持上下文连续性。教程提供了具体代码示例和架构设计思路，适合希望扩展 Claude 能力的开发者。

技巧 SuperClaude 框架工作流智能体会话记忆 Anthropic API

推荐理由：想用 Claude 做复杂自动化任务的开发者，这个框架能帮你把命令、智能体和记忆整合成一套可复用的工作流，比直接调 API 灵活得多，值得照着教程搭一套。

原文

10:50

Decoder@Matthias Bastian

Deepseek 宣布将其旗舰模型 V4-Pro 的 75% 折扣永久化，输入价格降至每百万 tokens 0.435 美元，比 GPT-5.5 便宜至少 11.5 倍，输出价格更是低 34 倍以上。这一激进定价策略针对 token 消耗大的智能体系统，可能对西方 AI 提供商造成巨大竞争压力。Deepseek 通过永久降价巩固其性价比优势，吸引更多开发者转向其平台。此举标志着 AI 模型价格战进入新阶段，尤其对依赖大规模推理的自动化应用影响深远。

AI模型 Deepseek V4-Pro 降价 GPT-5.5 智能体

推荐理由：做智能体或高 token 消耗应用的开发者，Deepseek 这个永久降价直接拉低了推理成本，比 GPT-5.5 便宜几十倍，值得立刻评估迁移。

原文

03:37

marktechpost@Michal Sutter

精选72°

腾讯开源了 TencentDB Agent Memory，一个完全本地的 AI 智能体记忆系统，采用 MIT 许可证。该系统结合了符号短期记忆（将冗长的工具日志压缩为紧凑的 Mermaid 任务画布）和四层长期记忆金字塔（L0 对话 → L1 原子 → L2 场景 → L3 人格）。它作为 OpenClaw 插件和 Hermes Docker 镜像提供，默认在本地 SQLite + sqlite-vec 上运行，并使用混合 BM25 + 向量检索与 RRF 融合。腾讯自己的基准测试显示，在 WideSearch 上使用 OpenClaw 时，令牌减少 61.38%，相对通过率提升 51.52%，PersonaMem 准确率从 48% 提升到 76%。

AI产品智能体记忆系统开源/仓库腾讯本地部署

推荐理由：腾讯开源的四层本地记忆管线解决了智能体长期记忆的痛点，做本地 AI 应用或智能体开发的团队可以直接集成，建议试试这个 MIT 许可的方案。

原文

5月23日

21:12

marktechpost@Asif Razzaq

精选

CopilotKit 在 2026 年发布了新的 AG-UI 协议、AIMock 测试套件和 Pathfinder 服务器，旨在为开发者提供生产级的智能体 AI 架构。AG-UI 协议标准化了智能体与用户界面的交互方式，AIMock 让开发者无需真实环境即可模拟和测试智能体行为，Pathfinder 服务器则优化了智能体决策路径的编排与执行。这些工具解决了智能体应用从原型到生产的关键痛点，使开发者能更高效地构建、测试和部署可靠的智能体系统。

AI产品智能体 CopilotKit AG-UI协议 AIMock Pathfinder

推荐理由：CopilotKit 的这套工具链直接解决了智能体 AI 从 demo 到生产环境的鸿沟，做智能体应用的开发者不用再自己造轮子，AG-UI 协议和 AIMock 值得一试。

原文

17:51

marktechpost@Asif Razzaq

精选

阿里巴巴 Qwen 团队在 2026 年阿里云峰会上推出 Qwen3.7-Max，这是其最先进的智能体模型。该模型拥有 100 万 token 的上下文窗口和扩展思考模式，专为长周期任务设计，包括编程、调试和多步骤工作流自动化。在 Artificial Analysis Intelligence Index 上得分为 56.6，在专有模型中排名第五。

AI模型 Qwen3.7-Max 推理模型智能体百万上下文编程助手

推荐理由：百万 token 上下文窗口让长代码库分析和复杂工作流自动化成为可能，做 AI 智能体或编程工具的开发者值得关注，可以直接用于长周期任务。

原文

5月22日

19:25

19:25IT之家（博客/媒体）

83°

阿里千问 App、PC 端及网页端正式接入全新一代大模型 Qwen3.7-Max，用户更新至最新版后即可免费体验。该模型定位为全能智能体基座，擅长编程、自动化办公和长周期自主执行任务。在长达35小时、超1000次工具调用的内核优化实验中，Qwen3.7-Max 展现了稳定的连贯推理能力。此外，它支持跨框架部署，如 Claude Code、OpenClaw 等，并即将通过阿里云百炼提供 API 调用。

AI产品 Qwen3.7-Max 千问智能体编程助手 MCP/工具

推荐理由：Qwen3.7-Max 解决了长周期自主执行任务的稳定性痛点，做自动化办公和复杂编程的开发者可以直接在千问 App 或网页端免费体验，值得一试。

原文

5月21日

16:03

pandaily@contact@pandaily.com (Pandaily)

智谱AI发布了名为AutoClaw的移动应用，作为AI智能体的新交互入口。该应用旨在让用户通过自然语言与AI智能体进行更直观的交互，完成复杂任务。AutoClaw的推出标志着智谱AI在智能体领域的重要布局，为用户提供了更便捷的AI服务使用方式。

AI产品智能体移动应用智谱AI AutoClaw 自然语言交互

推荐理由：智谱AI的AutoClaw App为AI智能体交互提供了更直观的移动入口，做AI应用开发或关注智能体生态的团队值得关注，可以直接体验其自然语言驱动的任务执行能力。

原文

10:48

宝玉的分享@宝玉

83°

Codex 官方团队分享了如何最大化利用 Codex 编程智能体的技巧，包括将其用于代码审查、自动化测试、生成文档等高级场景。文章强调，Codex 不仅能写代码，还能作为团队协作工具，提升开发效率。关键细节包括如何配置 Codex 以理解项目上下文、利用其生成 pull request 描述、以及结合 CI/CD 流程。这对希望从基础代码生成转向全流程自动化的开发者具有重要参考价值。

AI产品 Codex 编程助手自动化开发效率智能体

推荐理由：Codex 官方团队亲自拆解了从写代码到全流程自动化的进阶玩法，做 AI 编程的开发者看完能直接提升工具使用效率，建议点开对照自己的工作流优化。

原文

10:15

pandaily@contact@pandaily.com (Pandaily)

中国医疗 AI 公司 WiseDiag 在腾讯云 SkillHub 上推出了七项医疗 AI Skills，这些技能已完全集成到 WorkBuddy 多智能体工作台中。企业用户无需复杂开发即可通过 WorkBuddy 部署模块化的医疗 AI 智能体，实现快速落地。此举降低了医疗 AI 应用的门槛，让医院、诊所等机构能更便捷地利用 AI 辅助诊断、病历分析等场景。WiseDiag 的 Skills 覆盖多个医疗环节，展示了 AI 在垂直行业的实用化进展。

AI产品医疗 AI 智能体腾讯云 WiseDiag WorkBuddy

推荐理由：医疗行业终于有了开箱即用的 AI 方案——WiseDiag 的七项 Skills 让医院和诊所无需自研就能部署诊断辅助智能体，做医疗 IT 或数字化转型的团队可以直接在腾讯云上试用。

原文

07:59

07:59IT之家（博客/媒体）

精选

AMD AI 开发者大会 2026 首次在中国上海举办，AMD CEO 苏姿丰与零一万物创始人李开复围绕多智能体技术、端侧 AI 计算等议题展开对话。大会展示了锐龙 AI Max+ 系列处理器，支持 200B 参数模型本地运行，并宣布 ROCm 开源平台新增对锐龙 AI 400 系列的支持。惠普、华硕等厂商已推出超 35 款基于该处理器的智能体主机产品。大会还设置了 GPU 实操工作坊和技术研讨会，聚焦大模型推理优化、端侧智能体等前沿方向。

行业 AMD 智能体 ROCm 端侧AI 开发者生态

推荐理由：AMD 首次把开发者大会带到中国，苏姿丰和李开复的对话点出了端侧智能体主机的未来方向，做本地 AI 开发和部署的开发者值得关注 ROCm 的新支持和硬件生态。

原文

07:59

07:59IT之家（博客/媒体）

在 AMD AI 开发者日活动上，CEO 苏姿丰表示 AI 进步令人难以置信，预计未来五年将有 50 亿人每日使用 AI。她强调不存在单一应用满足需求，需要多样化的模型和工作流。苏姿丰称这是她 30 多年科技生涯中最兴奋的时刻，AI 在最近几个月加速发展，推理型 AI 更普遍，企业 CEO 们都在讨论如何利用 AI。她指出 AI 技术需要推理、学习和数据流能力，智能体是关键，未来 GPU 将无处不在，AMD 将提供端到端计算能力。

行业 AMD 苏姿丰 AI 趋势推理模型智能体

推荐理由：苏姿丰的发言揭示了 AI 从技术到落地的关键转折点——未来五年 50 亿用户意味着巨大的应用和基础设施机会，做 AI 开发或企业决策的人值得关注 AMD 的端到端计算布局。

原文

07:59

爱范儿@张子豪

AI产品 Gemini 3.5 智能体视频模型谷歌 AI 产品

推荐理由：谷歌用 AI 重新定义自家产品，做搜索、云服务和 AI 应用的团队值得关注——Gemini 3.5 和 Agent 可能改变你依赖的工具生态，建议点开看看具体怎么落地。

原文

07:59

07:59Simon Willison’s Weblog（博客/媒体）

72°

Google I/O 上发布了 Gemini Spark，定位为个人 AI 智能体，可原生连接 Gmail、Calendar、Drive 等 Google 应用。Spark 运行在 Gemini 3.5 Flash 和 Antigravity 上，后者是一个包含桌面应用、CLI 工具、SDK 和 IDE 的生态系统。Google 强调 Spark 采用企业级安全措施，包括隔离的临时 VM 和 DLP 策略，但 prompt injection 风险仍是隐忧。同时，开源 Gemini CLI 将于 6 月 18 日停止支持，被闭源的 Antigravity CLI 取代。

AI产品 Gemini Google I/O 智能体安全 Antigravity

推荐理由：Google 正式推出个人 AI 智能体 Gemini Spark，直接对标 OpenClaw，做自动化工作流的开发者值得关注其安全架构和 Antigravity 生态。

原文

5月20日

17:36

pandaily@contact@pandaily.com (Pandaily)

联想集团发布了天禧AI 4.0智能体系统，并推出包括掌上AI主机、PC、手机和平板在内的全生态设备。天禧Claw具备仿生记忆、个人知识库和AI同声传译功能。该生态通过优化算法实现了95%的Token成本降低，大幅提升AI应用的经济性。联想还展示了其首款大折叠屏手机，进一步丰富了AI终端形态。这一发布标志着联想在AI硬件与生态整合上的重要进展，为消费者和企业用户提供了更高效、低成本的AI解决方案。

AI产品联想天禧AI 4.0 智能体掌上AI主机大折叠手机

推荐理由：联想用掌上AI主机和95%成本降低，解决了AI落地贵、设备大的痛点，做AI硬件或企业部署的团队值得关注，尤其是想低成本试水AI终端的可以直接参考。

原文

14:00

pandaily@contact@pandaily.com (Pandaily)

72°

由前阿里巴巴达摩院研究员创立的杭州 AI 智能体初创公司 AutoAgents.ai 完成 Pre-A 轮融资，致力于构建一个自动化知识工作的智能平台。该平台定位为“数字劳动力工厂”，旨在通过 AI 智能体替代或辅助知识工作者完成重复性、流程化的任务。此举反映了 AI 智能体在知识工作自动化领域的商业化加速，尤其对需要处理大量文档、数据分析和流程管理的企业团队具有实际价值。

AI产品智能体知识工作自动化数字劳动力 AutoAgents.ai 融资

推荐理由：知识工作者终于有了正经的 AI 工具——AutoAgents.ai 把重复性脑力劳动自动化，做文档处理、数据分析的团队可以直接关注，看看能否替代部分人力成本。

原文

13:40

13:40IT之家（博客/媒体）

88°

阿里千问今日正式发布 Qwen3.7-Max，定位为面向智能体时代的旗舰模型，即将通过阿里云百炼 API 提供服务。该模型在编程、办公自动化、长周期自主执行等智能体任务上表现突出，例如在长达 35 小时、超 1000 次工具调用的内核优化实验中保持连贯推理。在多项基准测试中，Qwen3.7-Max 在编程智能体（如 SWE-Pro 60.6）、通用智能体（如 MCP-Mark 60.8）和推理（如 GPQA Diamond 92.4）上均取得领先或与顶尖模型相当的成绩。此外，它支持跨框架部署，兼容 Claude Code、OpenClaw 等，并具备多语言理解与翻译能力。

AI模型智能体编程助手 MCP/工具推理模型 Qwen3.7-Max

推荐理由：Qwen3.7-Max 在长周期自主执行和跨框架兼容性上展现出实用价值，做自动化办公或复杂编程的开发者可以直接通过 API 体验，值得关注。

原文

03:02

03:02IT之家（博客/媒体）

72°

在 2026 年谷歌 I/O 大会上，谷歌宣布升级 AI 创意平台 Google Flow，整合 Gemini Omni Flash 模型，提升视频编辑的精细度和角色一致性。同时推出 Google Flow Agent，作为智能伙伴辅助头脑风暴、内容生成和后期修改。新增 Flow Tools 支持自然语言定制工作流和工具分享，Flow Music 则提供更细粒度的分段编辑和重制功能。这些更新已向全球用户开放，旨在降低创作门槛并增强协作效率。

AI产品 AI 创意平台视频编辑智能体 Gemini Omni Flash 协作工具

推荐理由：视频创作者和内容团队终于有了一个能保持角色一致性的 AI 工具，Flow Agent 还能帮你头脑风暴剧情——做短视频或电影制作的人可以直接上手试试。

原文

02:26

02:26IT之家（博客/媒体）

88°

谷歌在2026 I/O大会上发布两大AI电商协议UCP和AP2，并推出Universal Cart通用购物车功能。UCP是开源协议，为智能体提供通用语言，类似HTTP对万维网的作用，已获亚马逊、Meta、微软等支持。AP2是智能体支付协议，可设置消费上限和支付验证。Universal Cart将于今夏在谷歌搜索、Gemini、YouTube、Gmail中推出，支持跨平台加购、追踪优惠、历史价格查询和补货提醒，还能智能推理用户选购，如检测CPU与主板不兼容并推荐替代品。这标志着AI电商从单点功能走向标准化生态，用户购物体验将更智能、更连贯。

AI产品智能体电商协议通用购物车谷歌开源/仓库

推荐理由：谷歌联合巨头定义AI电商标准，做电商或智能体开发的团队值得关注——UCP协议可能成为行业基础设施，通用购物车功能直接改变用户购物习惯。

原文

01:57

01:57IT之家（博客/媒体）

76°

谷歌在 2026 I/O 大会上发布了 Gemini Spark 个人 AI 智能体，它运行在专有虚拟环境中，用户合上电脑屏幕也不用担心数据被搞乱。Gemini Spark 由 Gemini 3.5 系列模型和 Google Antigravity 框架驱动，支持通过 MCP 协议与第三方工具集成。用户可通过手机自然语言对话创建任务，让 AI 在后台自动完成，例如整理邮件或筹划派对。该功能下周面向美国 Google AI Ultra 订阅用户推出，月费 100 美元起，今年夏天将实现在 Chrome 浏览器中直接运行。

AI产品智能体谷歌 Gemini Spark MCP/工具数据安全

推荐理由：谷歌终于解决了个人 AI 智能体的数据安全痛点——Gemini Spark 在隔离环境中运行，做多任务自动化的用户可以放心让它后台干活，不用盯着屏幕。

原文

01:46

01:46IT之家（博客/媒体）

76°

在 2026 年谷歌 I/O 大会上，谷歌宣布推出 Gemini 3.5 Flash 模型，该模型在多项基准测试中超越前代 3.1 Pro。其输出速度达到每秒 289 tokens，是 Claude Opus 4.7 和 GPT-5.5 xhigh 的 4 倍。谷歌内部还展示了 Antigravity 工具，用 93 个子智能体在 12 小时内从零构建了一个可运行的操作系统核心，生成了 26 亿个 tokens。这一发布标志着谷歌在 AI 模型速度和效率上的重大突破，尤其适合需要高吞吐量的应用场景。

AI模型 Gemini 3.5 Flash 谷歌推理模型输出速度智能体

推荐理由：速度翻倍意味着更低的延迟和更高的吞吐量，做实时 AI 应用或大规模推理的开发者值得关注，可以直接用起来提升效率。

原文

5月19日

23:07

Cloudflare Blog@Mike Nomitch

76°

Cloudflare 宣布与 Anthropic 合作，将 Claude Managed Agents 集成到其平台中，为自主代码交付提供快速、隔离的执行环境。开发者现在可以全球范围内扩展代理工作流，同时严格控制对私有后端的访问，并轻松定制代理的工具和运行时。这一集成解决了代理部署中的安全性和可扩展性问题，使得构建者能够更安全、高效地运行 AI 代理。对于需要大规模部署自主代理的团队来说，这是一个重要的基础设施升级。

AI产品 Claude Cloudflare 智能体 MCP/工具部署/基础设施

推荐理由：做 AI 代理部署的开发者终于有了一个安全、可扩展的托管方案——Cloudflare 的全球网络加上 Claude 的智能，建议做自动化工作流的团队直接试试。

原文

5月18日

22:29

22:29Hugging Face: Blog（博客/媒体）

精选76°

IBM Research 在 Hugging Face 上推出了 Open Agent Leaderboard，这是一个用于评估 AI 智能体性能的公开排行榜。该排行榜通过一系列标准化任务测试智能体的规划、工具使用和推理能力，旨在为开发者提供可复现的基准。目前已有多个主流模型参与评测，包括 GPT-4、Claude 等。这一举措有助于推动智能体领域的透明化和标准化，让开发者能更直观地比较不同智能体的实际表现。

行业智能体排行榜 IBM Hugging Face 评估基准

推荐理由：智能体评估一直缺乏统一标准，IBM 这个排行榜让开发者能直接对比不同模型的规划与工具使用能力，做智能体应用的团队值得关注。

原文

5月17日

19:53

19:53IT之家（博客/媒体）

OpenAI 员工、OpenClaw 项目创始人 Peter Steinberger 晒出 30 天内 OpenAI API 账单，高达 130 万美元（约 890.9 万元人民币），涵盖 760 万次请求和 6030 亿 token，全部由约 100 个 Codex 实例生成。这些智能体自主审核代码、筛查漏洞、编写修复代码，甚至参与会议并自动生成代码。Steinberger 表示这是无预算限制下测试 AI 辅助软件开发极限的实验，所有成果开源。账单中极速模式是主要成本来源，关闭后成本可降至约 30 万美元。此事引发对 AI 编程工具定价模式和实际算力成本的关注。

行业 AI 编程 Codex OpenClaw API 成本智能体

推荐理由：这 130 万美元账单揭示了 AI 编程工具在无预算约束下的真实能力上限，做自动化开发或研究 AI 编程极限的团队值得一看，看完会重新思考 Codex 的定价和实际价值。

原文

00:54

00:54IT之家（博客/媒体）

精选73°

蚂蚁集团旗下百灵大模型正式开源 Ring-2.6-1T，这是一款面向真实复杂任务场景的万亿级旗舰思考模型。该模型引入了可调节的 Reasoning Effort 机制，支持 high 与 xhigh 两种推理强度，开发者可根据任务复杂度灵活控制模型思考深度。high 模式适合高频 Agent 工作流，具备更低 Token 开销与更快多步执行能力；xhigh 模式面向数学、科研、复杂逻辑分析等高难任务。开源链接已在 Hugging Face 和 ModelScope 上提供，方便开发者、研究者与企业进行验证、适配和二次开发。

AI模型开源/仓库推理模型智能体蚂蚁集团 Ring-2.6-1T

推荐理由：万亿级思考模型开源，可调节推理强度让开发者按需平衡效果与成本，做 Agent 工作流或复杂推理的团队可以直接上手试。

原文

00:52

00:52IT之家（博客/媒体）

76°

OpenAI 在 IPO 前夕宣布大规模组织重组，将 ChatGPT、Codex 和 API 三大核心产品线合并为统一的产品组织。联合创始人 Greg Brockman 从幕后走向台前，全面接管产品战略，成为实际掌权者。ChatGPT 负责人 Nick Turley 被调离消费者产品线，由前 Instagram 副总裁 Ashley Alexander 接替。重组背后是高管空心化危机——多位核心高管近期离职，AGI 部署 CEO 因病休假。Brockman 正秘密开发代号“超级应用”的桌面端产品，整合聊天、编程和浏览器功能，旨在抢占智能体时代先机。

行业 OpenAI 组织重组超级应用智能体高管变动

推荐理由：OpenAI 这次重组暴露了高管流失的危机，但 Brockman 的超级应用计划可能重新定义 AI 产品形态。关注 AI 产品战略和智能体趋势的读者，值得了解这场硅谷权谋背后的技术野心。

原文