论文精选

LUCoS:无监督上下文选择提升表格基础模型性能

LUCoS: Latent Unsupervised Context Selection for Tabular Foundation Models

精选理由

做表格数据标注或低资源学习的团队,LUCoS解决了冷启动下上下文选择的核心难题,无需标签就能显著提升模型效果,值得在TabPFN等模型上试试。

AI 摘要

在低标注表格学习场景中,如何选择标注实例是关键挑战。对于TabPFN等表格基础模型,上下文选择直接影响预测性能。有监督实验表明,精心选择的标注集能显著优于随机选择。但冷启动场景(无标签时选择实例)研究不足。LUCoS方法利用无监督预训练网络的潜在几何结构选择代表性样本作为上下文,在67个数据集上平均AUC、ACC和F1排名第一。该方法通过覆盖度和表示空间的选择机制,有效避免了原始特征空间选择失效的问题。

AI 翻译 · 中文

在低标注表格学习场景中,如何选择标注实例是关键挑战。对于TabPFN等表格基础模型,上下文选择直接影响预测性能。有监督实验表明,精心选择的标注集能显著优于随机选择。但冷启动场景(无标签时选择实例)研究不足。LUCoS方法利用无监督预训练网络的潜在几何结构选择代表性样本作为上下文,在67个数据集上平均AUC、ACC和F1排名第一。该方法通过覆盖度和表示空间的选择机制,有效避免了原始特征空间选择失效的问题。

arXiv cs.LGSelecting which instances to label is a key challenge in low-label tabular learning. For recent Tabular Foundation Models such as TabPFN, context selection directly determines predictive performance. Supervised oracle ex