AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:Gemini Live×
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
6月9日
15:16
15:16AI Will@FinanceYF5
Google 在 Gemini Live 中新增了图像创建和编辑功能,用户可以在使用 Gemini 应用时实时生成或修改图像。该功能通过实时摄像头共享实现,用户可以向 Gemini 展示正在观看的内容,并即时要求其创建、调整或解释视觉内容。这一更新将 Gemini 从纯文本助手扩展为多模态交互工具,提升了实时视觉处理的实用性。目前该功能已上线,适用于支持 Gemini Live 的设备。
AI产品GoogleGemini Live实时图像生成多模态AI助手

推荐理由:实时图像生成与编辑让 Gemini 成为更强大的多模态助手,适合需要即时视觉创作或修改的用户,比如设计师、内容创作者和日常用户,建议打开 Gemini 试试这个新功能。
原文
5月24日
10:36
10:36Demis Hassabis@demishassabis
Garry Tan 宣布开源项目 GBrain 发布 v0.40.0 版本,基于 Gemini Live 构建语音智能体。该智能体支持大上下文、优秀工具使用和完整大脑访问,可赋予 OpenClaw/Hermes Agent 语音交互能力。Garry Tan 将其描述为“火星是朋友,金星是你的 EA”,并作为开源礼物分享。此项目展示了 Gemini Live 在语音智能体领域的实际应用潜力。
AI产品语音智能体Gemini Live开源/仓库GBrain智能体

推荐理由:语音智能体开发者可以直接用 GBrain 快速搭建基于 Gemini Live 的语音交互系统,开源且功能完整,值得一试。
原文
5月18日
21:09
21:09TestingCatalog@testingcatalog
72°
Google正在为其桌面版Gemini应用开发多项新功能,包括Gemini Live、Gemini Spark、Gemini Omni以及“Stream to Cursor”特性。其中,“Stream to Cursor”类似上周Android Show上公布的“Magic Pointer”,可能实现屏幕内容与AI的实时交互。Gemini Spark Agent可操作本地文件夹中的文件,而Gemini Omni内部被称为“Veo4 Omni”,暗示与视频生成模型Veo的整合。这些功能目前仍在开发中,Gemini Live尚未完全可用,但已有测试者展示了简短演示。
AI产品Gemini桌面应用Stream to CursorGemini Live本地文件操作

推荐理由:Google桌面Gemini即将迎来一波实用更新,尤其是Stream to Cursor和本地文件操作能力,对重度使用AI助手的开发者和办公用户来说,值得关注这些新功能如何提升日常效率。
原文
精选全部日报登录