Gemini Omni 多模态能力提升：可处理照片视频音频构建新场景

精选理由

Gemini Omni能处理视频/音频/图片并构建新场景

AI 摘要

Demis Hassabis 宣布 Gemini Omni 在多模态理解与编辑方面取得重大进展。该模型能处理照片、视频和音频输入，并构建全新场景。初期从视频开始，未来将支持任意输入与输出。用户可上传自己的视频并在其上迭代想法。

AI 翻译 · 中文

Demis HassabisGemini Omni is a major leap in world understanding & multimodal editing! It can take photos, video & audio and build entirely new scenes. Over time it’ll be able to handle any input & any output - starting w/…

查看原推