IT之家(博客/媒体)58谷歌正在开发名为 Gemini Spark 的智能体,它将嵌入 Gemini 聊天界面,能够直接替用户执行任务,而不仅仅是回答问题。Spark 可以清理 Gmail 收件箱、整理会议笔记、生成自定义新闻摘要,并支持创建可重复使用的技能模板。它还能执行多步骤工作流,索引多个应用信息,未来可能支持第三方应用。Spark 甚至可能使用独立 AI 模型,并控制 Chrome 浏览器,但暂不能像 Claude Cowork 那样控制整台电脑。AI产品智能体谷歌GeminiSpark自动化办公推荐理由:谷歌终于拿出了对标 Claude Cowork 的智能体方案,做自动化办公或依赖 Gmail/Workspace 的团队值得关注,Spark 的多步骤任务执行能力能直接提升效率。
IT之家(博客/媒体)精选53联发科在天玑开发者大会上发布天玑AI智能体化引擎2.0和开发套件3.0,并公布与OPPO、小米等厂商的合作成果。针对跨端智能体协同的痛点,联发科从IP设计、软件平台和生态层三个层面推进:统一NPU架构降低迁移成本,NeuroPilot平台实现一次开发多端部署,通过大模型和统一指令集打破生态壁垒。此外,联发科还讨论了AI定义汽车、内存涨价对端侧AI的影响,以及“龙虾”框架对芯片规划的启示。行业联发科智能体跨端协同天玑AI芯片推荐理由:联发科从芯片源头打通手机、汽车、眼镜等设备的智能体协同,做跨端AI应用的开发者可以直接参考其统一架构方案,避免重复适配。
IT之家(博客/媒体)58阿里发布 Qoder 1.0,将 AI IDE 升级为智能体自主开发工作台,支持 Windows、macOS 和 Linux。开发者定义目标后,Agent 可自主完成执行、验证和交付全流程。新版本将 Quest 模式升级为独立视窗,集成任务管理、状态追踪和知识调用能力。支持跨项目、跨代码库并行运行 Agent 任务,一屏掌握全局进展。新增自定义专家能力,开发者可创建专属 Agent 团队,配置领域知识和外部工具接口。AI产品AI编程智能体Qoder阿里开发工作台推荐理由:Qoder 1.0 把 AI 编程从辅助工具升级为自主工作台,解决了多任务并行和交付验证的痛点,做全栈开发的团队可以直接用它来提效。
OpenAI Blog(博客/媒体)63Sea Limited 的首席产品官 David Chen 分享了公司为何在工程团队中全面部署 OpenAI 的 Codex,以加速亚洲地区的 AI 原生软件开发。Codex 被用于自动化代码生成、调试和重构,显著提升了开发效率。Chen 强调,Codex 的智能体能力让开发者能专注于更高层次的设计和架构,而非重复性编码。这一部署标志着亚洲科技巨头在 AI 驱动开发上的重要一步,可能改变区域软件工程实践。行业Codex智能体AI 原生开发工程团队亚洲推荐理由:Sea 的实践展示了 Codex 在亚洲工程团队中的真实落地效果,做 AI 原生开发的团队可以借鉴其部署策略,直接提升开发效率。
IT之家(博客/媒体)60苹果公司正在内部讨论如何让使用AI Agent的编程类应用进入App Store,同时不打破现有审核规则。核心冲突在于Agentic Coding和Vibe Coding类应用能自动生成代码甚至新应用,这违反了苹果禁止在iPhone/iPad上直接编程并生成其他应用的规定。苹果担心一旦开闸,AI生成的新代码可能绕过安全审核,导致恶意软件风险,同时用户可能减少购买其他App,削弱App Store的分发和抽成收入。苹果正在探索折中方案,设计一套让相关应用遵守隐私和安全标准的系统,但能力更强的Agentic AI可能无法直接登陆iPhone。行业苹果App StoreAI编程审核规则智能体推荐理由:苹果的审核困境直接关系到AI编程工具能否在iOS生态落地,做AI开发或依赖App Store分发的团队需要关注这一政策走向,建议点开了解潜在影响。
IT之家(博客/媒体)50百度创始人李彦宏在Create 2026大会上提出,AI时代的核心度量衡应从Token消耗转向“日活智能体数”(DAA),类比移动互联网的DAU。他认为Token代表成本而非收益,衡量投入而非产出,而DAA更能反映平台生态的繁荣和实际价值。李彦宏强调,智能体时代应关注有多少智能体在为人类干活并交付结果。他还指出,智能体浪潮下,开发者、创业者和创造者实现了三位一体。行业智能体百度李彦宏DAAAI生态推荐理由:李彦宏的这个观点重新定义了AI价值的衡量标准,做AI平台和智能体生态的团队值得思考——别再只盯着Token消耗,DAA可能才是更接近商业本质的指标。
IT之家(博客/媒体)精选75微软CEO纳德拉宣布,其AI安全系统MDASH在5月补丁星期二活动中协助发现Windows 11的16个CVE漏洞。MDASH采用超过100个专用智能体,通过对抗式流程降低误报,在私有驱动StorageDrive上实现21个植入漏洞全检出且误报为0。在CyberGym公共基准上,MDASH以88.45%的准确率领先第二名(83.1%)约5个百分点。该系统还回溯了clfs.sys和tcpip.sys的历史漏洞,召回率分别达96%和100%。AI产品AI安全智能体MCP/工具微软MDASH推荐理由:微软用100个AI智能体抓漏洞,准确率88.45%
IT之家(博客/媒体)55鸿蒙智行旗下首款 9 系旗舰 MPV 智界 V9 官宣将搭载华为悦彰非凡系列音响,该音响系统与尊界 S800 同款。智界 V9 采用 9.3.8 独立声道设计,配备 35 单元扬声器和 2920W 功放,支持 720° 环绕音效和独立音区技术。通过 8 个头枕扬声器和隐私声盾 2.0 功能,前后排音频可独立播放且互不干扰,保障后排隐私。该车已开启预售,预售价 39.98 万元起,72 小时订单突破 22500 台,将于 5 月 15 日上市。AI产品智能体音频技术华为车载AI隐私保护推荐理由:智界 V9 的音响系统展示了华为在车载声学领域的创新,独立音区和隐私保护技术为 MPV 的多人出行场景提供了实用解决方案。
IT之家(博客/媒体)40海尔集团在泰国罗勇工业园奠基中央空调AI智能体智造基地,总投资超10亿元,占地约180亩,是海外首座中央空调AI智能体工厂,也是东南亚规模最大的中央空调智造基地。该项目旨在满足东南亚城市化带来的商用暖通需求增长,预计2030年区域订单需求将突破22万台。此前海尔已在泰国建成中国品牌在东南亚最大的家用空调智造基地。行业智能体大模型海尔东南亚制造业推荐理由:该基地是海尔在海外首座中央空调AI智能体工厂,标志着中国制造业在AI赋能下向东南亚高端市场扩张。
IT之家(博客/媒体)55小米澎湃OS 3的小米运动健康App为部分内测设备上线了Xiaomi miclaw手表版,这是一款基于小米MiMo大模型的腕上AI助理。用户按住手表说话,语音会传至手机端处理,结果以文字回显,无需掏出手机即可完成日常操作。该功能当前为内测版本,需满足特定机型、安装Xiaomi miclaw并加入内测名单等条件。此前Xiaomi miclaw已通过中国信通院手机端智能助手评估,成为国内首批通过该评测的手机端智能体。AI产品智能体大模型MiMoXiaomi miclaw小米推荐理由:小米将AI助理延伸至手表端,实现抬腕操作,提升了智能穿戴设备的实用性,对小米生态用户有实际价值。
Google Developers Blog(博客/媒体)35Google发布了Agent Development Kit (ADK) for Java 1.0.0版本,引入了Google Maps grounding、内置URL抓取和标准化Agent2Agent协议,支持跨框架协作。新架构包括App和Plugin,提供全局日志、自动上下文窗口管理(事件压缩)以及Human-in-the-Loop工作流。该版本还通过Firestore和Vertex AI集成,提供长期状态和大型数据管理。这表明Google进一步推动了Java生态中AI智能体的开发标准化。AI产品智能体GoogleADKJavaMCP/工具推荐理由:对于Java开发者而言,ADK 1.0.0降低了构建复杂AI智能体的门槛,尤其是Agent2Agent协议和云端集成促进了可扩展性。
Google Developers Blog(博客/媒体)65谷歌发布 ADK Go 1.0,将 AI 智能体开发从实验性脚本转向生产级服务。新版本原生集成 OpenTelemetry 实现深度追踪、新增插件系统支持自愈逻辑,并引入“人在回路”确认机制保障敏感操作安全。同时支持 YAML 配置快速迭代,并优化 Agent2Agent(A2A)协议实现跨语言通信。此次更新让开发者能基于 Golang 的高性能工程标准构建可靠的多智能体系统。AI产品智能体ADK Go可观测性A2A协议生产部署推荐理由:该版本补齐了 AI 智能体在生产环境中的可观测性、安全性和可维护性短板,对 Golang 技术栈构建复杂多智能体系统的团队意义重大。
Google Developers Blog(博客/媒体)65Agent开发工具包(ADK)的SkillToolset引入了"渐进式披露"架构,允许AI代理按需加载领域专业知识,与传统单一提示相比,Token使用量减少高达90%。该系统通过四种不同模式——从简单的内联清单到代理自己编写代码的"技能工厂"——使代理能够在运行时使用通用agentskills.io规范动态扩展其能力。这种模块化方法确保仅在相关时访问复杂指令和外部资源,为现代AI开发创建了可扩展且自扩展的框架。AI产品智能体MCP/工具Token优化Google ADK代理工程推荐理由:该架构显著降低了AI代理的Token成本(最高90%),并支持运行时动态能力扩展,为开发高效、可扩展的代理系统提供了可参考的工程化方案,尤其适用于需要处理复杂多步骤任务的场景。
Google Developers Blog(博客/媒体)65Google DeepMind推出Gemma 4系列开源模型,专为在设备端实现多步规划和自主智能体工作流而设计。该系列包含Google AI Edge Gallery供开发者实验“Agent Skills”,以及LiteRT-LM库,提供显著的速度提升和结构化输出。Gemma 4采用Apache 2.0许可,支持140多种语言,兼容移动设备、桌面电脑和Raspberry Pi等IoT平台。AI模型智能体Gemma 4边缘计算开源/仓库多模态推荐理由:此发布将前沿的智能体能力带入低功耗设备,为边缘AI应用(如本地化助手和离线自动化)提供了新的可能性,对开发者社区和物联网领域具有实际参考价值。
Google Developers Blog(博客/媒体)70Google Cloud AI Agent Bake-Off强调从提示工程转向严格的智能体工程,生产级AI需模块化、多智能体架构。文章提出五条关键建议:将复杂任务分解为专用子智能体,用确定性代码执行避免概率性错误,优先支持多模态和开源协议(如MCP),确保智能体可扩展、可集成,适应模型快速演进。AI产品智能体MCP/工具架构设计多模态生产部署推荐理由:这些技巧直接来自Google Cloud的实战经验,为开发者构建可靠、可维护的AI智能体提供了具体方法论,对行业从原型到落地的工程实践有重要参考价值。
Google Developers Blog(博客/媒体)60Google I/O开发者大会将于5月19日至20日举行,主题演讲将围绕“智能体时代”展开。大会将展示AI、Android、Chrome和Cloud领域的重要更新,重点推出用于自动化复杂工作流和简化高质量AI应用创建的新工具。参会者可注册参与现场会议、技术演示和职业发展资源。行业GoogleGoogle I/O智能体开发者大会AI工具推荐理由:作为年度重要开发者活动,Google I/O的日程安排和主题方向反映了AI技术的最新趋势,对开发者把握行业动态有参考价值。
Google Developers Blog(博客/媒体)35Google博客分享将脆弱的销售研究原型重构为生产级AI智能体的经验,基于Agent Development Kit (ADK)。通过用编排子智能体替代单体脚本,并使用Pydantic结构化输出,消除了静默失败和脆弱解析问题。文章强调动态RAG管道和OpenTelemetry可观测性对确保AI智能体可扩展、低成本且透明至关重要。技巧智能体MCP/工具Google ADK可观测性RAG推荐理由:本文提供了实用的工程经验,尤其适合正在将AI原型投入生产的开发者,展示了结构化设计和监控的重要性。
Google Developers Blog(博客/媒体)60Google发布Agent Development Kit (ADK),用于构建可长时间运行的AI智能体,例如HR入职流程。ADK通过持久化状态机和会话存储,确保智能体在闲置或服务器重启时不会丢失上下文。利用事件驱动webhooks和多智能体委托,智能体可以暂停、休眠并在恢复后继续复杂任务。这标志着从无状态聊天机器人到生产级企业工作流管理的关键转变。AI产品智能体Google ADK持久化工作流MCP/工具推荐理由:对于开发者而言,ADK解决了AI智能体在生产环境中长期运行的持久化和恢复问题,是构建可靠企业级自动化工作流的重要工具。该技术降低了AI应用落地的运维复杂度。
Google Developers Blog(博客/媒体)70Google 宣布 Gemini Embedding 2 正式可用,该模型能将文本、图像、视频、音频和文档映射到统一的语义空间,支持在单一请求中处理交错的多模态输入。它显著提升了智能体 RAG、视觉搜索和内容审核等任务的性能,支持超过 100 种语言,并提供任务特定前缀和 Matryoshka 维度缩减等功能。这使得构建复杂 AI 代理更加高效和精准。AI模型Gemini Embedding 2多模态智能体向量嵌入RAG推荐理由:对需要跨模态语义搜索和智能体构建的开发者而言,Gemini Embedding 2 的统一嵌入能力可简化架构并提升检索质量,值得关注其在实际部署中的表现。