AI暴露评分：衡量了什么、遗漏了什么、下一步是什么

精选理由

这篇论文拆解了被广泛引用的GPT暴露评分到底靠谱不，指出静态评分的坑，还给出了五类改进方向，搞AI政策或研究的人值得一看。

AI 摘要

2023年Eloundou等人计算的GPTs暴露评分成为工作未来辩论的核心输入，该评分定义暴露为LLM能辅助的职业任务占比。论文指出其存在时间、地理和本体论局限，并调查了五类应对研究：动态和基准度量、集成方法、任务框架扩展、以工人为中心的指标、采纳和使用数据。研究-政策协调不足，政策分析仍引用静态评分而未采纳方法论更新。建议政策制定者拓宽证据基础，研究者采用参与式方法并构建数据基础设施。

AI 翻译 · 中文

arXiv cs.AIA set of exposure scores calculated in 2023 has become a central empirical input to the future of work debate. Produced by Eloundou et al. (2023) and referred to here as the GPTs are GPTs scores, they define exposure as …

阅读原文