CrossMaps:置信度感知的开放词汇语义地图用于漫游车导航

CrossMaps: Confidence-Aware Open-Vocabulary Semantic Mapping for Rover Navigation

精选理由

这篇论文搞了个CrossMaps,让漫游车能用自然语言查地图,比VLMaps多了置信度融合和双记忆,在Jetson Orin上实时跑

AI 摘要

CrossMaps是一个实时开放词汇语义地图构建管道,使用RGB-D数据生成语言可查询的语义热图。它集成多尺度CLIP嵌入和置信度感知融合,通过几何、语义和时间置信度线索聚合噪声视觉观察。采用双记忆架构(短时记忆STM和长时记忆LTM),置信且一致的单元被提升为持久语义地标。在Jetson Orin驱动UGV上结合SLAM运行,支持自然语言查询导航。

AI 翻译 · 中文

CrossMaps是一个实时开放词汇语义地图构建管道,使用RGB-D数据生成语言可查询的语义热图。它集成多尺度CLIP嵌入和置信度感知融合,通过几何、语义和时间置信度线索聚合噪声视觉观察。采用双记忆架构(短时记忆STM和长时记忆LTM),置信且一致的单元被提升为持久语义地标。在Jetson Orin驱动UGV上结合SLAM运行,支持自然语言查询导航。

arXiv cs.LGRovers rely on perception to maintain spatial maps that encode both objects and sensor quality (e.g., range reliability, lighting artifacts, data density), guiding data fusion, embedding updates, and navigation under par