精选理由
这篇论文拆解了被广泛引用的GPT暴露评分到底靠谱不,指出静态评分的坑,还给出了五类改进方向,搞AI政策或研究的人值得一看。
2023年Eloundou等人计算的GPTs暴露评分成为工作未来辩论的核心输入,该评分定义暴露为LLM能辅助的职业任务占比。论文指出其存在时间、地理和本体论局限,并调查了五类应对研究:动态和基准度量、集成方法、任务框架扩展、以工人为中心的指标、采纳和使用数据。研究-政策协调不足,政策分析仍引用静态评分而未采纳方法论更新。建议政策制定者拓宽证据基础,研究者采用参与式方法并构建数据基础设施。
AI 翻译 · 中文
2023年Eloundou等人计算的GPTs暴露评分成为工作未来辩论的核心输入,该评分定义暴露为LLM能辅助的职业任务占比。论文指出其存在时间、地理和本体论局限,并调查了五类应对研究:动态和基准度量、集成方法、任务框架扩展、以工人为中心的指标、采纳和使用数据。研究-政策协调不足,政策分析仍引用静态评分而未采纳方法论更新。建议政策制定者拓宽证据基础,研究者采用参与式方法并构建数据基础设施。
A set of exposure scores calculated in 2023 has become a central empirical input to the future of work debate. Produced by Eloundou et al. (2023) and referred to here as the GPTs are GPTs scores, they define exposure as …