论文精选85°

从人类偏好中学习:安全AI新方法

精选理由

该方法解决了AI对齐中的核心难题——如何让AI理解人类真实意图,对构建可控AI系统具有里程碑意义。

AI 摘要

OpenAI与DeepMind合作开发了一种算法,通过比较两种行为的好坏来推断人类期望的目标。该方法避免了手动编写复杂目标函数可能导致的危险行为,为构建更安全的AI系统提供了关键思路。

图片来源 · OpenAI Blog
AI 翻译 · 中文

OpenAI与DeepMind合作开发了一种算法,通过比较两种行为的好坏来推断人类期望的目标。该方法避免了手动编写复杂目标函数可能导致的危险行为,为构建更安全的AI系统提供了关键思路。