Odyssey AI 发布 Starchild-1：全球首个实时多模态世界模型

精选理由

做 AI 模拟、游戏开发或虚拟现实的人会眼前一亮——Starchild-1 让世界模型从“只看”进化到“又看又听”，实时多模态融合直接拉高了物理模拟的真实感，值得关注它的后续开放计划。

AI 摘要

Odyssey AI 实验室发布了 Starchild-1，这是全球首个实时多模态世界模型。与以往只能生成画面的世界模型不同，Starchild-1 能同时生成真实世界的声音，实现视觉与听觉的同步融合。视频演示中，画面动态与声音实时匹配，营造出完整的场景模拟。这一突破不仅提升了视频生成的真实感，更被视为向通用世界模型迈出的关键一步，旨在让 AI 真正理解和模拟物理世界。

AI 翻译 · 中文

berryxia卧槽，这个模型真的有点东西啊! 看完后就想问什么时候可以上手啊！ Odyssey AI实验室刚刚扔出一个真正让人眼前一亮的家伙：Starchild-1。这是全球第一个实时多模态世界模型。它不只是生成画面，还能同时生成真实世界的声音。视频里你能看到一个完整的场景：画面在动，声音同步响起，视觉和听觉完全融为一体，像真正活过来的世界模拟。以前的世界模型大多只能“看”世界，现在Starchild-1直接学会了“听”。 …

查看原推