论文精选

DVMap:通过高共识人口-价值映射实现细粒度多元价值对齐

DVMap: Fine-Grained Pluralistic Value Alignment via High-Consensus Demographic-Value Mapping

精选理由

做 LLM 价值对齐的研究者终于有了从人口统计维度精细建模的方法——DVMap 用结构化 CoT 和 GRPO 实现了跨群体泛化,比国家标签更准,建议做 AI 伦理和可控生成的团队点开看看。

AI 摘要

当前大语言模型(LLM)通常使用粗粒度的国家标签进行多元价值对齐,但这会忽略国家内部的价值异质性,导致对齐松散。DVMap 提出从国家标签转向多维人口统计约束,通过世界价值观调查(WVS)构建包含 56,152 样本的高质量对齐语料库,并引入结构化思维链(CoT)机制引导模型推理人口与价值的关系。实验表明,Qwen3-8B-DVMap 在跨人口统计测试中达到 48.6% 准确率,超越 DeepSeek-v3.2(45.1%),并展现出强泛化性和鲁棒性。该框架解决了宏观标签无法捕捉群体内价值差异的问题,为 LLM 的多元对齐提供了更精细的解决方案。

AI 翻译 · 中文

当前大语言模型(LLM)通常使用粗粒度的国家标签进行多元价值对齐,但这会忽略国家内部的价值异质性,导致对齐松散。DVMap 提出从国家标签转向多维人口统计约束,通过世界价值观调查(WVS)构建包含 56,152 样本的高质量对齐语料库,并引入结构化思维链(CoT)机制引导模型推理人口与价值的关系。实验表明,Qwen3-8B-DVMap 在跨人口统计测试中达到 48.6% 准确率,超越 DeepSeek-v3.2(45.1%),并展现出强泛化性和鲁棒性。该框架解决了宏观标签无法捕捉群体内价值差异的问题,为 LLM 的多元对齐提供了更精细的解决方案。

arXiv: DeepSeekCurrent Large Language Models (LLMs) typically rely on coarse-grained national labels for pluralistic value alignment. However, such macro-level supervision often obscures intra-country value heterogeneity, yielding a lo