11:10arXiv cs.LG@Sepehr Dehdashtian, Jacob H Seidman, Vishnu N Boddeti, Gaurav Bharaj音频深度伪造检测(ADD)模型对防御恶意TTS至关重要,但现有数据集构建面临手动收集和盲点发现低效的挑战。FoeGlass是首个黑盒自动化红队测试方法,利用LLM的上下文学习能力探索TTS输入空间,仅需黑盒访问即可生成欺骗ADD的音频样本。通过基于多样性度量的上下文设计,FoeGlass缓解了模式崩溃问题,在多个开源ADD和TTS模型上使假阴性率比基线提升高达94%。生成的攻击可跨不同ADD迁移,且用FoeGlass样本微调ADD模型可提升鲁棒性达41%。论文音频深度伪造红队测试上下文学习LLM安全/对抗推荐理由:做音频安全或深度伪造检测的团队,终于有了一个无需手动标注就能自动发现模型盲点的工具——FoeGlass用LLM上下文学习就搞定了,建议直接跑一下开源代码看看效果。原文