15:16AI Will@FinanceYF5Google 在 Gemini Live 中新增了图像创建和编辑功能,用户可以在使用 Gemini 应用时实时生成或修改图像。该功能通过实时摄像头共享实现,用户可以向 Gemini 展示正在观看的内容,并即时要求其创建、调整或解释视觉内容。这一更新将 Gemini 从纯文本助手扩展为多模态交互工具,提升了实时视觉处理的实用性。目前该功能已上线,适用于支持 Gemini Live 的设备。AI产品GoogleGemini Live实时图像生成多模态AI助手推荐理由:实时图像生成与编辑让 Gemini 成为更强大的多模态助手,适合需要即时视觉创作或修改的用户,比如设计师、内容创作者和日常用户,建议打开 Gemini 试试这个新功能。原文
10:36Demis Hassabis@demishassabisGarry Tan 宣布开源项目 GBrain 发布 v0.40.0 版本,基于 Gemini Live 构建语音智能体。该智能体支持大上下文、优秀工具使用和完整大脑访问,可赋予 OpenClaw/Hermes Agent 语音交互能力。Garry Tan 将其描述为“火星是朋友,金星是你的 EA”,并作为开源礼物分享。此项目展示了 Gemini Live 在语音智能体领域的实际应用潜力。AI产品语音智能体Gemini Live开源/仓库GBrain智能体8 个信源在谈推荐理由:语音智能体开发者可以直接用 GBrain 快速搭建基于 Gemini Live 的语音交互系统,开源且功能完整,值得一试。原文
21:09TestingCatalog@testingcatalog72°Google正在为其桌面版Gemini应用开发多项新功能,包括Gemini Live、Gemini Spark、Gemini Omni以及“Stream to Cursor”特性。其中,“Stream to Cursor”类似上周Android Show上公布的“Magic Pointer”,可能实现屏幕内容与AI的实时交互。Gemini Spark Agent可操作本地文件夹中的文件,而Gemini Omni内部被称为“Veo4 Omni”,暗示与视频生成模型Veo的整合。这些功能目前仍在开发中,Gemini Live尚未完全可用,但已有测试者展示了简短演示。AI产品Gemini桌面应用Stream to CursorGemini Live本地文件操作3 个信源在谈推荐理由:Google桌面Gemini即将迎来一波实用更新,尤其是Stream to Cursor和本地文件操作能力,对重度使用AI助手的开发者和办公用户来说,值得关注这些新功能如何提升日常效率。原文