从人类偏好中学习：安全AI新方法

精选理由

该方法解决了AI对齐中的核心难题——如何让AI理解人类真实意图，对构建可控AI系统具有里程碑意义。

AI 摘要

OpenAI与DeepMind合作开发了一种算法，通过比较两种行为的好坏来推断人类期望的目标。该方法避免了手动编写复杂目标函数可能导致的危险行为，为构建更安全的AI系统提供了关键思路。

AI 翻译 · 中文