论文精选

TrajTok:自适应空间分词实现轨迹表征学习

TrajTok: Adaptive Spatial Tokenization for Trajectory Representation Learning

精选理由

做轨迹分析或时空数据挖掘的团队,TrajTok 提供了一种无需为每个任务单独训练模型的通用方案,值得关注其预训练权重和代码开源。

AI 摘要

TrajTok 是一种新型轨迹编码器,通过自适应多分辨率六边形网格分词和掩码标记预训练,从原始GPS轨迹中学习可迁移的轨迹表征。它解决了传统网格分词中细粒度导致稀疏、粗粒度混淆运动模式的问题。TrajTok 使用分解式Transformer编码器,分别处理几何和运动学特征,并通过交叉注意力融合。在Porto数据集上,冻结的TrajTok编码器配合轻量任务适配器,在轨迹相似性搜索、分类、预计到达时间等任务上超越多个专用方法。这表明多分辨率空间分词与掩码预训练是构建通用轨迹基础模型的有前景方向。

AI 翻译 · 中文

TrajTok 是一种新型轨迹编码器,通过自适应多分辨率六边形网格分词和掩码标记预训练,从原始GPS轨迹中学习可迁移的轨迹表征。它解决了传统网格分词中细粒度导致稀疏、粗粒度混淆运动模式的问题。TrajTok 使用分解式Transformer编码器,分别处理几何和运动学特征,并通过交叉注意力融合。在Porto数据集上,冻结的TrajTok编码器配合轻量任务适配器,在轨迹相似性搜索、分类、预计到达时间等任务上超越多个专用方法。这表明多分辨率空间分词与掩码预训练是构建通用轨迹基础模型的有前景方向。

arXiv cs.LGLearning generalizable trajectory representations from raw GPS traces remains difficult because the data is continuous, noisy, and irregularly sampled. Spatial tokenization is also challenging: fine grids yield sparse ce