evaluation·general

evaluation

别名
首次出现
2026-05-22
最近出现
2026-06-12
累计提及
78
§ 01综述

AI评估正从能力测试转向安全与偏见的深层考量。近期进展之一是针对生物威胁的风险评估:OpenAI评估GPT-4在生物威胁创造中的风险,开发了早期预警系统。同时,公平性成为焦点:评估ChatGPT的公平性表现提出新的评价方法。多模型联合评估也出现:OpenAI与Anthropic联合安全评估结果。此外,为应对幻觉问题,OpenAI分析了语言模型幻觉原因。诡计行为检测方面,检测并减少AI模型诡计行为引入新技术。政治偏见评估提出新方法定义评估LLM政治偏见。文化理解评估通过IndQA基准关注印度语言。评估标准更新体现于停止评估SWE-bench Verified,转向Pro版。系统卡发布如o3-mini系统卡提供透明度。经济价值评估出现GDPval,衡量AI真实贡献。当前焦点在于评估维度多元化,未来应关注如何平衡能力、安全与公平,并建立跨模型标准化评估框架。

§ 02相关报道10 条在档
  1. 01
    OpenAI评估GPT-4在生物威胁创造中的风险
    OpenAI Blog
  2. 02
    评估ChatGPT的公平性表现
    OpenAI Blog
  3. 03
    OpenAI与Anthropic联合安全评估结果
    OpenAI Blog
  4. 04
    OpenAI揭秘语言模型幻觉原因
    OpenAI Blog
  5. 05
    OpenAI与Apollo Research检测并减少AI模型诡计行为
    OpenAI Blog
  6. 06
    OpenAI评估ChatGPT政治偏见新方法
    OpenAI Blog
  7. 07
    OpenAI发布IndQA基准,评估印度语言AI文化理解
    OpenAI Blog
  8. 08
    OpenAI 停止评估 SWE-bench Verified,推荐 Pro 版
    OpenAI Blog
  9. 09
    OpenAI o3-mini 系统卡发布
    OpenAI Blog
  10. 10
    OpenAI发布GDPval:评估模型真实经济价值
    OpenAI Blog
§ 03邻近话题

本页综述由 AITOP 基于公开报道整理。原报道版权归各自来源所有。

/topic/evaluation