AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:无位姿多视图×
6月16日
20:46
AITOP6月16日 20:46
600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI600亿美元买下Cursor,xAI终于拿到了编程工具,但真正值得跟踪的或许不是AI
6月12日
12:57
AITOP6月12日 12:57
Claude代码里藏了个20260612,18个月后的AI记忆革命已经开始倒计时
6月11日
15:28
AITOP6月11日 15:28
1107 vs 303:谷歌悄悄开源了一个“拆打字机”的模型,把大模型速度翻了4倍
15:23
AITOP6月11日 15:23
DiffusionGemma颠覆文本生成?自回归模型的“统治”要结束了
15:07
AITOP6月11日 15:07
每秒1107个token,Google开源的扩散模型为什么能改变本地推理格局?
5月18日
11:44
11:44arXiv cs.AI@Yuqi Wu, Tianyu Hu, Wenzhao Zheng, Yuanhui Huang, Haowen Sun, Jie Zhou, Jiwen Lu
精选
IVGT提出了一种隐式视觉几何Transformer,能从无位姿的多视图图像中学习连续的神经场景表示。与现有方法预测显式点图不同,IVGT在规范坐标系中隐式建模连续几何,支持任意3D位置的连续空间查询。通过轻量解码器预测符号距离函数值和颜色,可直接提取连续表面几何,并渲染任意视角的RGB图、深度图和法线图。模型经多数据集联合训练,在网格/点云重建、新视角合成、深度/法线估计和相机位姿估计等任务上表现优异,展现了跨场景的泛化能力。
论文3D重建神经场景表示隐式几何Transformer无位姿多视图

推荐理由:做3D重建和神经渲染的团队终于有了一个无需相机位姿就能生成连续几何的通用方案——IVGT直接解决了显式点图冗余和几何不连续的老问题,做多视图重建的开发者值得一试。
原文
精选全部日报登录