全部 AI 动态 · AI 热点

5月20日

01:55

01:55IT之家（博客/媒体）

72°

在 2026 年 Google I/O 大会上，谷歌宣布了 Android Halo 功能，旨在提升手机端 AI 助手的透明度。该功能会在屏幕顶部显示一个低调的状态提示，告知用户 AI 智能体是否正在运行、进入实时模式或发送消息。用户无需切换应用即可掌握 AI 执行进度，解决了过去需要反复查看 Gemini 等助手应用的痛点。Android Halo 首先支持 Gemini Spark，并计划在今年晚些时候扩展到其他 AI 智能体。这标志着 AI 行为从后台黑箱走向前台可感知的系统级透明化。

AI产品 Android Halo Gemini AI 智能体系统级透明化谷歌 I/O

推荐理由：Android Halo 解决了 AI 助手执行状态不透明的痛点，让手机用户无需频繁切换应用就能感知智能体进度。经常使用 Gemini 或 AI 助手的安卓用户，值得关注这项即将上线的系统级透明化功能。

原文

01:45

01:45IT之家（博客/媒体）

在 2026 年谷歌 I/O 大会上，谷歌宣布 Gemini 集成 C2PA 内容凭证，以增强对深度伪造的防御能力。此前，谷歌的 SynthID 已为 10 亿张图片和视频及 6 万年的音频添加水印，Gemini 平台上“数百万人”正在使用 SynthID。现在，用户可在谷歌搜索和 Chrome 浏览器中圈选或右键点击图片，询问是否经过 AI 编辑。谷歌 CEO 桑达尔现场演示了识别一张他与马斯克、奥特曼、黄仁勋吃汉堡的 AI 图像，并指出“这显然是假的”。

AI产品谷歌 Gemini C2PA 内容凭证深度伪造

推荐理由：AI 图片真假难辨的时代，谷歌把验证能力直接集成到搜索和浏览器里，关心信息可信度的用户和内容创作者可以直接用起来。

原文

01:29

01:29IT之家（博客/媒体）

在2026年谷歌I/O开发者大会上，CEO皮查伊宣布谷歌每月处理的Token量已超过3200万亿，同比增长7倍。Gemini App月活跃用户超9亿，日请求量增长超7倍。Nano Banana模型累计生成超500亿张图片。这些数据表明谷歌AI基础设施和用户规模正快速扩张。

行业谷歌 Token Gemini AI基础设施开发者大会

推荐理由：谷歌AI规模暴增7倍，做AI基础设施或大模型应用的开发者值得关注这一趋势，了解行业天花板在哪里。

原文

01:23

Logan Kilpatrick@OfficialLoganK

精选

Google 发布新模型 Gemini Omni，支持从文本、图像等任意输入生成视频，类似 Nano Banana 能力。当前可在 Gemini App、Flow 和 YouTube 中使用。API 支持即将推出。

AI模型 Gemini Omni Google 视频生成

推荐理由：Gemini能直接生成视频了

原文

5月19日

23:00

Weaviate@weaviate_io

精选

Weaviate推出新方法，使用Gemini embedding 2 multimodal直接对视频片段进行嵌入。无需转录文本或元数据，将原始视频分割成重叠片段后即可存入Weaviate。用户提问后系统直接从视频中定位相关片段并生成回答。该方法简化了视频搜索流程，消除了预处理步骤。相关notebook和完整指南已在GitHub和Weaviate博客发布。

技巧 Weaviate Gemini 多模态视频检索

推荐理由：视频搜索不用转文字了

原文

15:14

15:14IT之家（博客/媒体）

精选

科技媒体 sammyguru 报道，谷歌计划调整免费版 Gemini 的计量方式，从短周期恢复机制改为“每周额度”管理。用量页面已出现面向免费用户的每周上限展示方式，以百分比形式呈现总周用量。目前该限制仅向少量用户开放，谷歌尚未说明全面推送时间。高频用户可能比过去更容易在短时间内耗尽额度。

AI产品 Gemini Google 免费版周限额使用限制

推荐理由：谷歌要给 Gemini 免费版设周限额了，高频用户注意。

原文

12:55

arXiv: OpenAI@Tanmay Asthana, Aman Saksena, Divyansh Sahu

精选76°

研究人员发布了针对深度研究代理（DRA）在管理咨询场景下的评测基准，包含42个专家撰写的任务，每个任务有平均13.8个确定性验证器和五维度0-3分专家评分。评测了Claude Opus 4.6、OpenAI o3-deep-research和Google Gemini 3.1 Pro，三者通过联合阈值（专家评分≥2.5且验证器通过率≥80%）的接受率均很低：Gemini 21.4%，o3和Claude仅9.5%。各模型失败模式不同：Claude输出最可靠但虚构最多，o3推理最清晰但遗漏章节和传播算术错误，Gemini表现两极分化。该基准通过嵌入认知陷阱来惩罚表面模式匹配，揭示了当前前沿DRA在专业分析任务上的严重不足。

论文评测基准深度研究代理管理咨询 Claude OpenAI o3 Gemini 认知陷阱

推荐理由：管理咨询团队和依赖AI做深度分析的开发者会震惊——三个最先进的DRA在专家级任务中通过率不到22%，且各有致命短板。想避免被AI的自信输出误导，建议仔细看这篇评测的失败模式分析。

原文

5月18日

21:09

TestingCatalog@testingcatalog

72°

Google正在为其桌面版Gemini应用开发多项新功能，包括Gemini Live、Gemini Spark、Gemini Omni以及“Stream to Cursor”特性。其中，“Stream to Cursor”类似上周Android Show上公布的“Magic Pointer”，可能实现屏幕内容与AI的实时交互。Gemini Spark Agent可操作本地文件夹中的文件，而Gemini Omni内部被称为“Veo4 Omni”，暗示与视频生成模型Veo的整合。这些功能目前仍在开发中，Gemini Live尚未完全可用，但已有测试者展示了简短演示。

AI产品 Gemini 桌面应用 Stream to Cursor Gemini Live 本地文件操作

推荐理由：Google桌面Gemini即将迎来一波实用更新，尤其是Stream to Cursor和本地文件操作能力，对重度使用AI助手的开发者和办公用户来说，值得关注这些新功能如何提升日常效率。

原文

11:49

11:49IT之家（博客/媒体）

据彭博社记者马克·古尔曼爆料，苹果将在下月WWDC上发布全新独立Siri应用，支持聊天记录自动删除功能，用户可设置30天、1年或永久保留。新版Siri将搭载谷歌Gemini大模型，但数据在苹果私有云端服务器运行，谷歌不会用于训练。该应用将随iOS 27正式推出，但初期仍标注测试版，并提供退出测试的开关。这一隐私功能类似iMessage，旨在增强用户对对话数据的控制。

AI产品苹果 Siri 隐私 Gemini iOS 27

推荐理由：苹果终于给Siri加了正经的隐私控制，做AI产品的团队可以看看苹果如何平衡大模型能力和用户数据保护，隐私敏感用户值得关注。

原文

5月17日

00:17

AI Will@FinanceYF5

Google 发布全新视频模型 Gemini Omni，首个生成结果展示了惊人的文字连贯性。该模型在视频中保持了文字的一致性和可读性，被认为是视频领域的“Nano Banana 时刻”。这一突破可能改变视频生成和编辑的方式，尤其对内容创作者和视频制作团队意义重大。目前该模型尚未正式开放，但已引发广泛关注。

AI模型 Gemini 视频模型文字连贯性内容创作 Google

推荐理由：做视频生成或内容创作的团队，Gemini Omni 的文字连贯性可能是你一直在等的突破，值得第一时间关注。

原文

5月16日

18:03

Philipp Schmid@_philschmid

精选

Android 16 将原生支持 MCP（模型上下文协议），允许应用通过 `@AppFunction` 注解将功能暴露为工具，供 Gemini 等智能体调用。该机制完全在设备本地运行，无需服务器或网络往返，智能体可以跨应用链式调用功能，例如在一个应用中搜索邮件，在另一个应用中添加购物清单。目前已有早期访问计划开放测试。这标志着 Android 系统级智能体能力的重大升级，开发者可以开始探索如何让应用与 AI 智能体深度协作。

AI产品 Android MCP/工具 Gemini 智能体跨应用操作

推荐理由：Android 原生 MCP 让跨应用智能体操作不再依赖云端，做 Android 应用开发的团队可以直接接入测试，让 Gemini 帮你打通应用间的数据与功能。

原文

5月15日

22:30

22:30IT之家（博客/媒体）

谷歌正在开发名为 Gemini Spark 的智能体，它将嵌入 Gemini 聊天界面，能够直接替用户执行任务，而不仅仅是回答问题。Spark 可以清理 Gmail 收件箱、整理会议笔记、生成自定义新闻摘要，并支持创建可重复使用的技能模板。它还能执行多步骤工作流，索引多个应用信息，未来可能支持第三方应用。Spark 甚至可能使用独立 AI 模型，并控制 Chrome 浏览器，但暂不能像 Claude Cowork 那样控制整台电脑。

AI产品智能体谷歌 Gemini Spark 自动化办公

推荐理由：谷歌终于拿出了对标 Claude Cowork 的智能体方案，做自动化办公或依赖 Gmail/Workspace 的团队值得关注，Spark 的多步骤任务执行能力能直接提升效率。

原文

5月14日

19:09

Google DeepMind@GoogleDeepMind

Google DeepMind 正在用 AI 重新设计鼠标指针这一经典界面，通过结合运动、语音和自然简写，让用户更直观地指挥 Gemini 完成屏幕操作。实验性演示展示了如何通过手势、说话或简单指令直接与 AI 交互，从而提升操作效率。这一创新有望改变人机交互方式，让计算机更智能地理解用户意图。

AI产品人机交互 Gemini Google DeepMind AI 助手界面创新

推荐理由：鼠标指针 50 年没变过，DeepMind 这次用 AI 把它变成了智能助手——做交互设计或产品经理的值得关注，看完会重新思考「点击」这件事。

原文

19:09

Google DeepMind@GoogleDeepMind

Google DeepMind 宣布其基于 Gemini 的编码智能体 AlphaEvolve 在过去一年中加速了多个领域的进步，包括量子计算、生物技术、物流和 Google 的 AI 基础设施。该智能体利用算法优化，从自然世界的物理规律到航运路线规划等几乎每个生活方面都有应用。AlphaEvolve 展示了 AI 在解决复杂现实问题中的潜力，标志着编码智能体从实验室走向实际应用的重要一步。

AI产品编码智能体 Gemini AlphaEvolve 量子计算物流优化

推荐理由：AlphaEvolve 将 AI 编码能力从理论推向实际产业应用，做科研、物流或基础设施优化的团队可以关注它如何加速你的工作流。

原文

17:38

17:38IT之家（博客/媒体）

英特尔和高通分别在社交媒体上确认参与谷歌全新Googlebook笔记本电脑项目，该项目将同时支持x86和ARM双架构。谷歌在I/O大会上预告了这款融合安卓与ChromeOS特性的新系统，并深度集成Gemini AI大模型。首批设备将搭载英特尔、高通和联发科处理器，主打高端AI原生体验，可原生运行安卓应用，无需模拟器。谷歌副总裁透露，Googlebook将在内存、存储、键盘做工等方面设立严苛硬件标准，确保统一高端体验，预计今年秋季上市。

AI产品谷歌 Googlebook AI笔记本 x86 ARM Gemini

推荐理由：谷歌首次将x86与ARM架构统一到AI原生笔记本平台，做硬件或系统开发的团队值得关注这一新品类，看看Gemini如何深度集成到核心体验中。

原文

07:45

07:45IT之家（博客/媒体）

欧盟要求谷歌开放安卓系统，让第三方AI服务能像Gemini一样调用系统功能、读取屏幕上下文和本地数据。苹果公司提交意见，警告此举将严重威胁用户隐私、安全及设备完整性。苹果认为AI系统风险不可预测，且欧盟评估时间过短（不到3个月），用自身判断替代了谷歌工程师的判断。谷歌此前也已反对该方案。这场争议关乎AI生态的开放与安全平衡，影响所有安卓用户和AI开发者。

行业 AI监管欧盟安卓 Gemini 隐私安全

推荐理由：苹果罕见为谷歌站台，揭示欧盟AI监管的深层矛盾——开放与安全的拉锯战。做AI产品、关注欧盟数字政策的从业者，值得了解这场可能重塑安卓AI生态的博弈。

原文

01:10

Noam Shazeer@NoamShazeer

Google 发布了 Gemini 3.1 Flash Live 模型，专为生产级可靠性设计。该模型在复杂函数调用和长时推理基准测试中领先，支持多语言，已用于搜索直播功能。开发者可借此构建可扩展的语音优先智能体，完成复杂任务。

AI模型 Gemini 语音智能体函数调用多语言推理模型

推荐理由：语音智能体开发者终于有了一个生产级模型——Gemini 3.1 Flash Live 在复杂函数调用和长时推理上表现领先，做语音交互的团队可以直接上手试试。

原文

01:10

01:10IT之家（博客/媒体）

谷歌在 Android Show 上宣布推出 AI 语音听写功能 Rambler，集成于 Gboard 输入法。该功能由 Gemini 多语言模型驱动，能自动删除填充词（如“呃”“啊”），并理解句中的即时修正。Rambler 支持“代码切换”，即在同一句话中混合使用多种语言而不丢失上下文。谷歌强调该功能不会存储语音录音，结合设备端与云端处理以保护隐私。初期仅限三星 Galaxy 和谷歌 Pixel 手机在夏季上线，后续扩展至其他 Android 设备。

AI产品 Gemini 语音听写 Gboard 多语言隐私保护

推荐理由：多语言混合输入是很多用户的痛点，Rambler 用 Gemini 模型解决了跨语言听写时的上下文断裂问题，经常用语音输入或需要中英混说的用户值得关注。

原文

5月13日

21:36

21:36IT之家（博客/媒体）

谷歌正与宏碁、华硕、戴尔、惠普和联想等 OEM 厂商合作，将 Chromebook 品牌升级为“Googlebook”。新品牌将深度整合 Gemini AI 服务，包括“魔术光标”功能，可读取屏幕内容并利用 Gemini 理解上下文提供额外信息。系统还支持 Android 手机跨平台协同，用户可直接在笔记本上操作手机。官方渲染图中出现了一款带有 RGB 发光灯带的笔记本，称为“Glowbar”，其具体作用尚不明确。目前尚不清楚 Googlebook 是否会搭载传闻中的“Aluminum OS”，更多细节可能在明天的 Android Show I/O Edition 活动中公布。

AI产品 Googlebook Chromebook Gemini AI 整合跨平台协同

推荐理由：谷歌将 Chromebook 升级为 Googlebook 并深度整合 Gemini，对 Chromebook 用户和 AI 爱好者来说是一次品牌和体验的双重升级，值得关注明天的 I/O 活动。

原文

21:36

21:36IT之家（博客/媒体）

谷歌在 2026 年 I/O 大会前正式宣布推出 Googlebooks 高端安卓笔记本品类，这是一个类似 Chromebooks 的合作品牌体系，由宏碁、华硕、戴尔、惠普、联想等厂商首发，今年秋季上线。Googlebooks 主打高端市场，外观上配备发光灯带设计，核心软件亮点包括 Gemini 集成的 Magic Pointer 光标交互功能和 Create My Widget 小组件生成功能，支持跨设备协同。此举被视为谷歌整合 ChromeOS 与 Android 战略的重要信号，Chromebooks 仍支持 10 年生命周期，但未来方向可能转向安卓与 Gemini 为核心。

AI产品谷歌 Googlebooks 安卓笔记本 Gemini 跨设备协同

推荐理由：Googlebooks 标志着安卓笔记本从低端走向高端独立品类，Gemini 深度集成带来光标交互和小组件生成等新体验，关注安卓生态和笔记本形态的开发者与用户值得关注秋季首发机型。

原文

21:36

21:36IT之家（博客/媒体）

谷歌在2026年I/O活动中宣布推出基于安卓技术栈、内置Gemini的高端笔记本新类别Googlebooks，首批产品将于秋季上线。针对现有Chromebook用户，谷歌确认2021年及之后发布的机型可获得10年自动软件更新，部分更早机型也符合延长条件。谷歌未正面回应未来是否继续推出新Chromebook，但合作品牌后续发布计划仍不明朗。Googlebooks定位高端，对标MacBook和高端Windows笔记本，而Chromebook仍主打低价教育市场。谷歌确认部分现有Chromebook硬件“有资格过渡到新体验”，可能获得部分Googlebooks式功能。

AI产品谷歌 Chromebook Googlebooks Gemini 笔记本

推荐理由：谷歌同时押注两条笔记本产品线，做教育或轻量办公的Chromebook用户不必担心支持断档，10年更新承诺很实在；而追求高端体验的开发者可以关注Googlebooks如何整合Gemini，秋季新品值得蹲一波。

原文

21:36

21:36IT之家（博客/媒体）

谷歌在 2026 年 Android Show I/O 活动中宣布 Android Auto 多项更新，核心是让车联系统更贴合不同车型屏幕并接近手机体验。新版 Google Maps 采用贴边全屏设计，加入沉浸式 3D 导航，显示建筑、高架、地形和交通信号灯等细节。车载娱乐方面，停车或充电时支持 60fps 全高清视频播放，覆盖 BMW、Ford、Mercedes-Benz 等品牌，车辆移动后自动暂停。音频升级杜比全景声，首批覆盖 BMW、Genesis 等品牌。Gemini 智能助手将扩大车载覆盖，可结合上下文回复短信或辅助下单 DoorDash。

AI产品 Android Auto Google Maps Gemini 车载娱乐导航

推荐理由：这次更新让车载系统更接近手机体验，尤其全屏地图和 60fps 视频解决了导航和停车娱乐的痛点，开车或充电时用 Android Auto 的车主值得关注。

原文

19:05

The Rundown AI@TheRundownAI

今日AI领域多则重磅消息：Google发布新书并推出Android版Gemini Intelligence；Google与SpaceX合作探索轨道AI计算；Claude Code可被用于华尔街级金融分析；Amazon的AI计分板扭曲了工作激励；另有4款新AI工具及社区工作流发布。这些动态覆盖了从移动端AI到太空计算、从金融应用到职场伦理的广泛议题，反映了AI技术加速渗透各行业。

行业 Google Gemini Claude Code Amazon AI工具

推荐理由：想快速掌握AI行业最新动向的读者，这一条帮你省下刷10个信源的时间——从Google的太空计算到Claude Code的金融应用，每一条都值得点开细看。

原文

15:38

15:38IT之家（博客/媒体）

精选

谷歌DeepMind在2026年The Android Show上发布Magic Pointer功能，旨在通过光标交互让AI理解用户意图，而不仅仅是识别指向位置。该功能允许用户通过语音和指针结合，自然地说“改一下这个”或“把那个移到这里”，无需复制粘贴内容到AI窗口。核心原则包括保持工作流、边指边说、支持模糊指代，以及将像素转化为可操作实体。谷歌已在AI Studio上线演示，并逐步将能力引入Chrome中的Gemini，让用户直接围绕网页内容操作。这标志着AI交互从独立窗口转向融入用户当前工具，提升效率。

AI产品谷歌 Magic Pointer 光标交互 AI助手 Gemini

推荐理由：谷歌把AI交互从“复制粘贴到对话框”变成了“指哪打哪”，做办公自动化或日常多任务处理的用户，可以直接在Chrome里试，体验比划式操作。

原文

15:38

15:38IT之家（博客/媒体）

谷歌在 I/O 2026 上预览了安卓 Create My Widget 功能，允许用户通过自然语言描述需求，自动生成个性化主屏幕小部件。该功能将于今年夏季上线，核心是将手动配置流程改为“说出需求即可生成”，例如创建只显示风速和降雨的天气小部件。它还能从网络抓取信息并连接 Gmail、Calendar 等谷歌应用，整合成单一仪表盘，减少应用切换。该功能依赖 Gemini 对世界的知识和个人数据调用能力，旨在提升个性化和效率。

AI产品自然语言生成小部件安卓 Gemini 个性化

推荐理由：安卓用户终于能告别繁琐的小部件配置——用自然语言一句话生成专属信息面板，做日程管理或信息聚合的可以直接等夏季更新。

原文

14:52

Geek@geekbb

精选

一个开源项目用纯HTML/CSS/JS复刻了Google Antigravity UI，在浏览器中直接运行。它集成了xterm.js终端和WebContainer，允许AI Agent自动执行命令和修改文件。目前仅支持Gemini模型，处于Alpha版本。作者因学业繁忙已开源至GitHub，期待社区接手。

AI产品 Gemini xterm.js WebContainer Antigravity UI 智能体

推荐理由：浏览器里跑AI终端，Agent还能自己改文件

原文

09:12

TestingCatalog@testingcatalog

Google 在 Gemini 网页版新增了 Omni 横幅，预示即将推出多模态 Agent 功能。Gemini Omni 将能结合文本、图像和视频，并允许用户将自己添加到不同场景中。同时，AI 头像（Likeness）功能也即将登陆 Gemini，可能与 Omni 深度集成，该功能在移动端应用上表现突出。这一更新可能于今日的 Android 发布会上公布。

AI产品 Gemini 多模态 Agent AI头像 Google

推荐理由：Gemini Omni 的推出标志着 Google 在多模态 AI Agent 领域的重大进展，结合 AI 头像功能，将显著提升用户交互体验。

原文

09:12

TestingCatalog@testingcatalog

Google 在 Android Show 2026 上发布了全新的 Android Intelligence，带来多项 AI 功能。新系统支持跨应用自动执行多步骤任务，Gemini 在 Chrome 中新增 Browser Use 功能，可自动填写表单。此外，还推出了“Rambler”语音转文字工具和自定义生成 UI 组件。这些更新显著提升了 Android 的智能化水平，为用户带来更便捷的交互体验。

AI产品智能体多模态大模型 Android Gemini

推荐理由：Android Intelligence 的发布标志着 Google 在移动端 AI 集成上的重要进展，其自动化任务和语音转文字功能将直接影响用户日常使用。

原文

09:12

The Rundown AI@TheRundownAI

Google DeepMind 发布了一个演示，将 Gemini AI 直接集成到用户的鼠标指针中。这个简单的界面升级为 AI 时代提供了更直观的交互方式。它展示了如何通过鼠标指针无缝调用 AI 功能，可能改变用户与 AI 的日常互动。该演示强调了界面设计的创新，而非复杂的技术突破。

AI产品 Gemini AI交互界面设计 Google DeepMind

推荐理由：该演示展示了 AI 交互的实用创新，通过鼠标指针集成 Gemini，提升了用户与 AI 的日常互动体验。

原文

09:12

The Rundown AI@TheRundownAI

75°

在#TheAndroidShow活动中，Google宣布Android操作系统将集成Gemini AI层，实现跨应用任务自动化。新推出的Googlebooks笔记本系列专为Gemini Intelligence设计，支持Android应用和自定义小部件，并配备AI驱动的“Magic Pointer”光标。此外，Gemini Intelligence将覆盖Galaxy、Pixel设备及Wear OS、Android Auto等平台，提供如拍照自动预订酒店、语音创建购物清单等功能。Google产品管理副总裁Mindy Brooks表示，Android正从操作系统转变为智能系统。

行业大模型 Gemini 智能体 Android AI安全

推荐理由：Google将AI深度整合到Android生态中，从笔记本到手机操作系统均实现智能化，标志着移动设备向AI原生体验的重大转变。

原文

5月11日

22:16

Google AI@GoogleAI

在Google I/O大会前11天，Google AI本周密集发布6项更新：Google Health应用集成Gemini健康教练，结合可穿戴设备、健身应用和医疗记录提供主动健康指导；Gemma 4模型引入多令牌预测（MTP）机制，工作流速度提升达3倍；NotebookLM新增自动来源组织和可定制思维导图；Gemini API文件搜索工具支持多模态、自定义元数据和页面引用；Gemini API新增Webhook推送通知功能替代轮询；Nano Banana、Veo和Google Photos Remix等AI功能上线Google TV。

行业 Gemini 谷歌I/O 多模态智能体编程效率

推荐理由：此次更新覆盖健康、编程、搜索、文档协作和智能电视等多个场景，显示Google正在将AI能力系统化整合至其生态产品矩阵，对开发者生态和终端用户体验均产生实质影响。

原文