多样性(Diversity)在人工智能领域是一个多维概念,既涉及技术层面的算法设计,也延伸至社会层面的机会公平。近期进展主要集中在两个方向:一是通过算法提升数据或结果的多样性以避免过拟合或重复,二是通过人才项目促进群体多样性。
在技术层面,研究者关注如何系统性地增强数据多样性。一篇预印本论文提出基于Outlierness(异常度)和Uncertainty(不确定性)的轨迹数据增强选择策略,相比随机方法更稳定,可有效提升模型泛化能力 (轨迹数据增强的系统选择方法:Outlierness 和 Uncertainty 策略更稳定)。同时,向量数据库Weaviate在1.37版本中引入MMR(最大边际相关性)算法,用于在搜索结果中平衡相关性与多样性,减少重复结果,提升用户体验 (Weaviate 1.37 引入 MMR 算法,解决向量搜索重复结果问题)。
在社会层面,OpenAI学者计划自2018年启动,持续为弱势群体(包括女性和少数族裔)提供深度学习研究机会,2019年申请开启并迎来第八位跨领域学者,2021年公布最终项目成果 (OpenAI学者计划2019申请开启;OpenAI学者计划:为弱势群体提供深度学习机会;OpenAI Scholars 2019:八位跨领域学者;OpenAI Scholars 2021 最终项目发布)。该计划旨在通过支持来自不同背景的人才,推动AI研究视角的多样化。
当前焦点在于:技术多样性方面,如何平衡“多样性”与“精确性”——例如在轨迹增强中如何避免引入噪声,在搜索中如何避免过度稀释相关性;社会多样性方面,短期项目能否真正改变行业长期的性别和种族结构失衡。值得观察的是,这类精英培育计划是否能规模化复制,以及其在算法公平性领域的间接影响。