11:38arXiv cs.AI@Manjinder Singh, Alexander E. I. Brownlee, Mohamed Elawady这篇论文提出GAversary,一种混合遗传算法(GA)用于生成对抗攻击,只需黑盒访问目标模型的logit输出。GAversary利用GloVe嵌入实现词替换(变异算子),提升对抗样本的语义相似性。在多个基准数据集和知名模型上测试,GAversary将目标模型准确率从76.8%降至5.8%,而对比方法BAE仅降至27.6%。代价是扰动词数约为BAE的两倍,语义相似度略低,运行时间增加约5%。论文GAversaryGloVe对抗攻击遗传算法AI安全推荐理由:这篇论文搞了个GAversary,用遗传算法和GloVe嵌入做黑盒文本攻击,能把模型准确率从76.8%打到5.8%,比BAE狠多了。原文