论文精选

SAGE:可扩展自动门控集成方法用于欺诈检测中的可信负样本挖掘

SAGE: Scalable Automatic Gating Ensemble for Confident Negative Harvesting in Fraud Detection

精选理由

SAGE解决了欺诈检测中难以区分合法异常与真实欺诈的痛点,做风控或流媒体反作弊的团队可以直接参考其门控集成思路,值得一试。

AI 摘要

音乐流媒体欺诈(如人为刷播放量)对平台和创作者构成威胁,但传统检测方法难以区分合法边缘案例(如超级粉丝、睡眠音乐会话)与欺诈行为。研究者提出SAGE方法,结合SimHash分层采样与模块化门控集成,从无标签数据中可靠识别负样本。该方法通过可配置统计门(马氏距离和k-NN密度)实现精度-召回率自适应权衡,并解决正-无标签学习中的表示偏差问题。在客户级和艺术家级欺诈检测任务上均表现优异,无需修改核心方法即可跨领域泛化。

AI 翻译 · 中文

音乐流媒体欺诈(如人为刷播放量)对平台和创作者构成威胁,但传统检测方法难以区分合法边缘案例(如超级粉丝、睡眠音乐会话)与欺诈行为。研究者提出SAGE方法,结合SimHash分层采样与模块化门控集成,从无标签数据中可靠识别负样本。该方法通过可配置统计门(马氏距离和k-NN密度)实现精度-召回率自适应权衡,并解决正-无标签学习中的表示偏差问题。在客户级和艺术家级欺诈检测任务上均表现优异,无需修改核心方法即可跨领域泛化。

arXiv cs.LGMusic streaming fraud, where bad actors artificially inflate stream counts to manipulate chart rankings and royalty payments, poses a significant threat to streaming services and legitimate content creators. Traditional