16:59小互@imxiaohu76°OpenAI 产品负责人 Nick Turley 介绍了 Auto Review 功能,通过两个 Agent 协作:主 Agent 执行任务,第二 Agent 实时验证每个动作,防止伤害用户。该功能源于安全与对齐团队的研究,旨在让用户放心将敏感数据访问权交给 Agent,整夜运行而无需担忧。它首次将 AI 对齐研究以普通用户可用的方式落地,从论文中的理论曲线变为实际的安全保障。用户只需在第二天批准关键操作,其余由 Agent 自动完成。AI产品AI安全Agent监督OpenAI对齐研究自动化10 个信源在谈推荐理由:这是 AI 对齐研究首次以普通用户可用的方式落地,做自动化或敏感数据处理的团队终于可以放心让 Agent 整夜跑任务,建议试试这个安全机制。原文