3D生成领域近期进展迅速,核心趋势是速度、精度和可控性的显著提升,同时技术路线向多模态融合和开放词汇方向发展。
- 主要进展:
- 生成速度与面数突破:Hyper3D发布Rodin Gen-2.5,宣称4秒即可生成百万面级3D模型,并且一张图即可生成千万级面数的3D资产(小互、向阳乔木)。这标志着3D内容创造成本大幅降低。
- 部件级可控生成:新研究CubePart提出开放词汇的部件可控3D生成器,允许用户通过自然语言控制生成对象的特定部件,提升可编辑性(arXiv)。
- 多模态融合构建完整世界:World Labs联合Hunyuan 3D和ElevenLabs,实现了从输入图片生成包含网格、物理、光照和音频的3D世界(Justine Moore)。类似地,新开源工具包支持Claude Code一键生成环境、网格、物理、光照和音频(Justine Moore, berryxia)。
- 新方法提升细节精度:Pixal3D提出像素对齐的3D生成方法,专注于几何与纹理的精细度(AK)。此外,GPT image 2结合Gemini 3.1 pro被用于生成3D生物结构页面,展示端到端生成能力(岚叔)。
当前焦点:行业正从单纯生成形状转向生成完整、可交互的3D世界,强调速度、低面数却高质量资产的快速产出,以及通过语言和图像的控制精细度。同时,开源工具和多模型组合方案降低了门槛,使得非专业用户也能快速创建3D内容。
未来观察点:关注生成模型在游戏、影视、机器人模拟(如李飞飞强调的空间智能与无限数字宇宙)等场景的落地;部件可控生成如何影响创作者工作流;以及千万级面数模型在实时渲染中的优化。