QC-SMOTE:质量控制SMOTE用于不平衡分类

QC-SMOTE: Quality-Controlled SMOTE for Imbalanced Classification

精选理由

这篇论文提出了QC-SMOTE,在30个数据集上比传统SMOTE获得更好的AUC和F1分数,特别适合处理中度到高度不平衡的数据。

AI 摘要

QC-SMOTE提出一种质量控制过采样框架,通过复合邻域信任度评分估计少数类样本可靠性。生成候选样本时采用IPQ引导的最佳K策略,评估中点纯度并考虑多数类清除。方法根据重叠-不平衡程度自适应调整插值范围和选择标准。在30个不平衡数据集上的重复分层交叉验证显示,QC-SMOTE在平均AUC-ROC和Macro F1上优于对比过采样方法,在中度和严重不平衡下提升尤为明显。

AI 翻译 · 中文

QC-SMOTE提出一种质量控制过采样框架,通过复合邻域信任度评分估计少数类样本可靠性。生成候选样本时采用IPQ引导的最佳K策略,评估中点纯度并考虑多数类清除。方法根据重叠-不平衡程度自适应调整插值范围和选择标准。在30个不平衡数据集上的重复分层交叉验证显示,QC-SMOTE在平均AUC-ROC和Macro F1上优于对比过采样方法,在中度和严重不平衡下提升尤为明显。

arXiv cs.LGClass imbalance poses a significant challenge in classification, where existing methods such as SMOTE often generate low-quality synthetic samples in regions with noise or class overlap. We propose QC-SMOTE, a quality-co