12:14arXiv cs.AI@Haorui Ji, Weizhe Liu, Hongdong Li, Hengkai GuoFLUX3D 提出了一种从单张图像生成高保真 3D 高斯泼溅(3DGS)的新方法。它通过设计 Diffusion-Aligned Structured Latents (DA-SLAT) 改进稀疏体素表示,并用 Sparse-structure Multimodal Diffusion Transformer (SMDiT) 和 Modal-Aware Rotary Positional Embedding (MARoPE) 解决二维图像令牌与三维体素潜在的对齐问题。在多个基准测试中,FLUX3D 在外观保真度上显著优于现有最先进方法,生成的 3DGS 资产质量更高。AI模型FLUX3D3D生成高斯泼溅扩散模型稀疏表示推荐理由:想从单张图生成高质量3D模型?FLUX3D用扩散对齐稀疏表示解决了细节丢失问题,效果比现有方法好一截,值得搞3D生成的看看。原文
12:04arXiv cs.AI@Chenrui Fan, Paolo FavaroOrbitForge利用冻结的视频先验和逐提示高斯泼溅重建优化,将单个文本生成视频转换为规范闭环轨道3D高斯泼溅场景。它通过可变形高斯泼溅和稳健MedianGS代理获得初步3D重建,然后渲染指定轨道视图检测缺失视角。该方法仅补全缺失视角并重建最终场景,无需任务特定视频或多视角微调。在300提示T3Bench审计中,OrbitForge达到了359.0度中位数跨度,并将Q10 ImageReward从8.07提升至16.36,同时与VideoMV保持竞争力。论文OrbitForgeT3Bench3D场景生成高斯泼溅文本到3D推荐理由:OrbitForge用文本直接生成360度3D场景,解决了视频视角不全的问题,效果比单用MedianGS好很多。原文