diversity

§ 01综述

多样性（Diversity）在人工智能领域是一个多维概念，既涉及技术层面的算法设计，也延伸至社会层面的机会公平。近期进展主要集中在两个方向：一是通过算法提升数据或结果的多样性以避免过拟合或重复，二是通过人才项目促进群体多样性。

在技术层面，研究者关注如何系统性地增强数据多样性。一篇预印本论文提出基于Outlierness（异常度）和Uncertainty（不确定性）的轨迹数据增强选择策略，相比随机方法更稳定，可有效提升模型泛化能力 (轨迹数据增强的系统选择方法：Outlierness 和 Uncertainty 策略更稳定)。同时，向量数据库Weaviate在1.37版本中引入MMR（最大边际相关性）算法，用于在搜索结果中平衡相关性与多样性，减少重复结果，提升用户体验 (Weaviate 1.37 引入 MMR 算法，解决向量搜索重复结果问题)。

在社会层面，OpenAI学者计划自2018年启动，持续为弱势群体（包括女性和少数族裔）提供深度学习研究机会，2019年申请开启并迎来第八位跨领域学者，2021年公布最终项目成果 (OpenAI学者计划2019申请开启；OpenAI学者计划：为弱势群体提供深度学习机会；OpenAI Scholars 2019：八位跨领域学者；OpenAI Scholars 2021 最终项目发布)。该计划旨在通过支持来自不同背景的人才，推动AI研究视角的多样化。

当前焦点在于：技术多样性方面，如何平衡“多样性”与“精确性”——例如在轨迹增强中如何避免引入噪声，在搜索中如何避免过度稀释相关性；社会多样性方面，短期项目能否真正改变行业长期的性别和种族结构失衡。值得观察的是，这类精英培育计划是否能规模化复制，以及其在算法公平性领域的间接影响。

§ 02相关报道07 条在档

§ 03邻近话题