12:39arXiv cs.AI@Marija Slavkovik, Marie Farrell, Louise Dennis, Michael Fisher, Simon Kolker, Emily C. Collins精选这篇论文探讨了如何设计能够负责任地拒绝用户请求的自主智能体。作者指出,机器不服从有多种形式,并提出了实现负责任不服从的关键要素:任务拒绝的理由、覆盖不服从的途径,以及安全风险和责任的追踪。该研究为构建更安全、更可靠的AI系统提供了理论基础,尤其适用于需要自主决策的智能体场景。论文智能体AI安全负责任AI自主决策论文推荐理由:AI安全研究者或智能体开发者会关心:如何让AI在必要时说“不”而不失控?这篇论文给出了系统性的框架,值得深入阅读。原文