Mod-Guide:基于LLM的内容审核系统,提升对少数族裔敏感言论的识别

Mod-Guide: An LLM-based Content Moderation Feedback System to Address Insensitive Speech toward Indigenous Ethnic and Religious Minority Communities

精选理由

内容审核系统常忽视文化隐性歧视,Mod-Guide通过RAG融入少数群体视角,做AI伦理或内容审核的团队值得关注其方法论。

AI 摘要

该论文针对LLM在内容审核中难以识别针对少数族裔(如孟加拉国印度教和查克马社区)的文化隐性歧视问题,提出Mod-Guide系统。研究通过社区合作构建文化敏感语料库,并利用检索增强生成(RAG)将少数群体视角融入审核流程。实验表明,RAG增强的审核响应在文化准确性上显著提升,且不同族群对审核结果的感知存在差异。这项工作为AI伦理和内容审核设计提供了修复性正义和解释学包容的新路径。

AI 翻译 · 中文

该论文针对LLM在内容审核中难以识别针对少数族裔(如孟加拉国印度教和查克马社区)的文化隐性歧视问题,提出Mod-Guide系统。研究通过社区合作构建文化敏感语料库,并利用检索增强生成(RAG)将少数群体视角融入审核流程。实验表明,RAG增强的审核响应在文化准确性上显著提升,且不同族群对审核结果的感知存在差异。这项工作为AI伦理和内容审核设计提供了修复性正义和解释学包容的新路径。

arXiv cs.AILanguage operates as a mechanism of both marginalization and resistance, especially for minority communities navigating insensitive and harmful speech online. As content moderation increasingly depends on large language