10:56arXiv cs.LG@Bartłomiej Baranowski, Dave Zhenyu Chen, Matthias NießnerOneCanvas将多视角patch特征投影到等距柱状全景画布,并添加3D坐标的位置嵌入。无需复杂几何编码器或大量训练预算。在SQA3D和VSI-Bench上达到SOTA准确率,在SPBench上泛化到分布外数据。训练计算量比最强竞争方法少一个数量级。论文OneCanvasSQA3DVSI-Bench3D场景理解空间推理推荐理由:OneCanvas用全景投影做3D理解,训练少10倍,在SQA3D上SOTA,适合机器人和具身AI。原文