全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月9日

15:16

15:16

AI Will@FinanceYF5

Google 在 Gemini Live 中新增了图像创建和编辑功能，用户可以在使用 Gemini 应用时实时生成或修改图像。该功能通过实时摄像头共享实现，用户可以向 Gemini 展示正在观看的内容，并即时要求其创建、调整或解释视觉内容。这一更新将 Gemini 从纯文本助手扩展为多模态交互工具，提升了实时视觉处理的实用性。目前该功能已上线，适用于支持 Gemini Live 的设备。

AI产品 Google Gemini Live 实时图像生成多模态 AI助手

推荐理由：实时图像生成与编辑让 Gemini 成为更强大的多模态助手，适合需要即时视觉创作或修改的用户，比如设计师、内容创作者和日常用户，建议打开 Gemini 试试这个新功能。

5月24日

10:36

10:36

Demis Hassabis@demishassabis

Garry Tan 宣布开源项目 GBrain 发布 v0.40.0 版本，基于 Gemini Live 构建语音智能体。该智能体支持大上下文、优秀工具使用和完整大脑访问，可赋予 OpenClaw/Hermes Agent 语音交互能力。Garry Tan 将其描述为“火星是朋友，金星是你的 EA”，并作为开源礼物分享。此项目展示了 Gemini Live 在语音智能体领域的实际应用潜力。

AI产品语音智能体 Gemini Live 开源/仓库 GBrain 智能体

推荐理由：语音智能体开发者可以直接用 GBrain 快速搭建基于 Gemini Live 的语音交互系统，开源且功能完整，值得一试。

5月18日

21:09

21:09

TestingCatalog@testingcatalog

72°

Google正在为其桌面版Gemini应用开发多项新功能，包括Gemini Live、Gemini Spark、Gemini Omni以及“Stream to Cursor”特性。其中，“Stream to Cursor”类似上周Android Show上公布的“Magic Pointer”，可能实现屏幕内容与AI的实时交互。Gemini Spark Agent可操作本地文件夹中的文件，而Gemini Omni内部被称为“Veo4 Omni”，暗示与视频生成模型Veo的整合。这些功能目前仍在开发中，Gemini Live尚未完全可用，但已有测试者展示了简短演示。

AI产品 Gemini 桌面应用 Stream to Cursor Gemini Live 本地文件操作

推荐理由：Google桌面Gemini即将迎来一波实用更新，尤其是Stream to Cursor和本地文件操作能力，对重度使用AI助手的开发者和办公用户来说，值得关注这些新功能如何提升日常效率。