精选理由
这项研究揭示了AI在复杂场景推理上的真实短板,做体育内容或依赖AI分析的团队可以借此评估工具边界,值得点开看看AI到底哪里不行。
北卡罗来纳大学教堂山分校和美国东北大学的研究人员发现,主流AI模型在分析职业体育比赛时表现很差。他们创建了名为SVI-bench的新基准测试,包含35000小时比赛画面等数据,测试AI在感知、推理、模拟和自主行动能力。AI在基础感知任务中识别准确率约74%,但在因果推理环节成功率仅约40%,模拟球员下一步动作接近随机猜测,自主分析准确率只有5%。研究人员指出,AI擅长描述画面,但无法解释原因或预测未来,这意味着体育主播等需要深度理解的工作暂时不会被取代。
AI 翻译 · 中文
北卡罗来纳大学教堂山分校和美国东北大学的研究人员发现,主流AI模型在分析职业体育比赛时表现很差。他们创建了名为SVI-bench的新基准测试,包含35000小时比赛画面等数据,测试AI在感知、推理、模拟和自主行动能力。AI在基础感知任务中识别准确率约74%,但在因果推理环节成功率仅约40%,模拟球员下一步动作接近随机猜测,自主分析准确率只有5%。研究人员指出,AI擅长描述画面,但无法解释原因或预测未来,这意味着体育主播等需要深度理解的工作暂时不会被取代。
IT之家 6 月 6 日消息,据外媒 Futurism 今天(6 日)晚间报道,北卡罗来纳大学教堂山分校和美国东北大学研究人员的一项新研究发现,主流 AI 模型在分析职业体育比赛时 表现很差 。这项研究目标是考察热门 AI 模型在感知、推理、模拟和自主行动能力四个方面的表现,现有测试方法很难准确评估这些能力。不过需要注意的是,其尚未经过同行评审。 为测试 AI 在这些方面究竟能做到何种程度,研究人员把职业体育比赛做成了一套新基准。新测试…