Cluster LOCO:用于解释聚类的特征重要性方法

Cluster LOCO: Feature Importance For Interpreting Clusters

精选理由

能解释聚类结果依赖哪些特征

AI 摘要

Cluster LOCO 是一种模型无关的聚类特征重要性打分方法,基于特征遮挡和聚类泛化性。它通过衡量移除某个特征后聚类标签在留出样本上的预测准确度下降来量化特征重要性。研究提出了基于数据划分的Cluster LOCO-Split和面向大规模数据的Cluster LOCO-MP(minipatch集成版)。在合成数据和单细胞转录组学的细胞类型发现任务中,Cluster LOCO比现有方法更可靠地恢复有信息量的特征。

AI 翻译 · 中文

Cluster LOCO 是一种模型无关的聚类特征重要性打分方法,基于特征遮挡和聚类泛化性。它通过衡量移除某个特征后聚类标签在留出样本上的预测准确度下降来量化特征重要性。研究提出了基于数据划分的Cluster LOCO-Split和面向大规模数据的Cluster LOCO-MP(minipatch集成版)。在合成数据和单细胞转录组学的细胞类型发现任务中,Cluster LOCO比现有方法更可靠地恢复有信息量的特征。

arXiv cs.LGClustering is widely used for exploratory analysis and scientific discovery, driving insights from market segmentation to biological data analysis, but its outputs can be difficult to interpret, audit, and reproduce as m