Google AI 近期动作密集,围绕 Gemini 生态推出了多项面向用户和开发者的功能升级,并探索 AI 与物理世界的交互。
- 主要进展
- 实时语音翻译与订阅权益扩展:Google 发布 Gemini 3.5 Live Translate,支持 70+ 语言的实时语音翻译,显著提升了多语言沟通体验;同时,AI Ultra 订阅用户率先获得网页端新功能,后续计划向更多用户开放。(Google 发布 Gemini 3.5 Live Translate,实时语音翻译支持 70+ 语言) (Google AI Ultra 订阅用户率先体验网页端新功能)
- NotebookLM 重大升级:推出智能体对话与高级推理能力,用户可与 AI 进行更自然的交互,并处理更复杂的分析任务。(NotebookLM 重大升级:智能体对话与高级推理上线)
- 视频生成模型 Gemini Omni 发布:该模型能推理物理世界并生成连贯视频,向订阅用户开放,标志着 Google 在多模态生成上的突破。(Gemini Omni 推出:能推理物理世界的视频生成模型)
- Project Genie 与 Science Skills:Project Genie 将街景转化为可提示的世界模拟器,降低 3D 内容创建门槛;Science Skills 则整合 30+ 生命科学模型,助力加速科研。(Project Genie 将 Google Maps 街景转为可提示世界模拟器) (Google AI 推出 Science Skills,整合 30+ 生命科学模型加速研究)
当前焦点:Google 正通过 Gemini 生态将 AI 能力深度嵌入搜索、翻译、笔记、地图等核心应用,并向科研和内容创作领域扩展。其订阅分层策略(Plus/Pro/Ultra)加速了新功能的商业转化。
未来观察点:Gemini Omni 在物理世界推理上的表现是否能为机器人、自动驾驶等场景赋能;NotebookLM 的智能体对话能否成为下一代信息管理入口;以及 Project Genie 这类世界模拟器如何平衡开放性与伦理风险。