11:07arXiv cs.AI@Kaidi Zhang, Guanxu Zhu精选本文提出一种基于可微多平面图像(MPI)的新视角合成方法,旨在平衡渲染速度、模型大小和稀疏视图下的性能。该方法利用视觉基础模型预测的点图进行几何初始化,并通过可微优化调整MPI层。为解决稀疏初始化导致的空洞和伪影问题,引入了一步扩散模型,同时参与MPI优化和渲染后处理。与基于3D高斯泼溅的代表性方法相比,该方法在正面视图场景下速度提升30.7%,模型大小仅为其14.8%,同时保持竞争性的合成质量。论文新视角合成多平面图像可微优化稀疏视图轻量级模型推荐理由:对于需要在新视角合成中兼顾速度、模型大小和稀疏视图性能的开发者,该方法提供了一个轻量级替代方案,比3DGS快30%且模型小85%,值得在移动端或资源受限场景下尝试。原文
16:08pandaily@contact@pandaily.com (Pandaily)76°字节跳动开源了Lance,一个仅3B激活参数的原生统一多模态AI模型。Lance能在一个系统中同时处理图像理解、图像生成和视频任务,无需多个模型拼接。该模型采用原生多模态架构,而非传统的视觉编码器+语言模型组合,实现了更高效的跨模态交互。Lance的开源发布为多模态AI研究提供了轻量级基线,尤其适合资源受限场景下的部署。AI模型多模态模型开源/仓库字节跳动Lance轻量级模型推荐理由:Lance用3B参数实现了图像理解+生成+视频的统一处理,做多模态应用或边缘部署的团队可以直接拿来用,省去多模型集成的麻烦。原文