CADE: 直接时间步嵌入与对比对齐的时间序列问答框架

Beyond Tokenization: Direct Timestep Embedding and Contrastive Alignment for Time-Series Question Answering

精选理由

这篇论文提出CADE,解决了LLM处理时间序列时丢了数值信息的痛点,用直接时间步嵌入和对比对齐,在Time-MQA上比GPT-4还强。

AI 摘要

论文提出CADE框架,用于时间序列问答。该框架通过点式线性编码器和MLP投影器将每个时间步直接映射到LLM嵌入空间,避免分词瓶颈和固定窗格损失。引入单向监督对比损失对齐时间序列嵌入与冻结类名文本锚点。在Time-MQA基准上,CADE在六个TSQA任务中一致优于开源和闭源LLM基线。

AI 翻译 · 中文

论文提出CADE框架,用于时间序列问答。该框架通过点式线性编码器和MLP投影器将每个时间步直接映射到LLM嵌入空间,避免分词瓶颈和固定窗格损失。引入单向监督对比损失对齐时间序列嵌入与冻结类名文本锚点。在Time-MQA基准上,CADE在六个TSQA任务中一致优于开源和闭源LLM基线。

arXiv cs.AIRecent advances in large language models (LLMs) have given rise to time-series question answering (TSQA), which formulates time-series analysis as natural-language question answering. However, directly feeding raw numeri