面向人工智能冲突场景的心智理论因果模型

A Causal Model of Theory of Mind in Conflict for Artificial Intelligence

精选理由

这篇论文给AI装了个'读心开关'——只在冲突场景下按需启动心智推理,既省算力又提升准确性,值得做AI安全和多智能体的人看看。

AI 摘要

该论文构建了一个结构因果模型(DAG),将心智理论视为由情境与主体条件激活的机制,而非始终开启的能力。模型包含四个外生变量(如冲突强度、信息可及性)和五个内生中介变量,通过可处理性路径、推理深度路径和使能原因路径三种机制决定心智理论的参与状态。主要输出变量是认知准确性,该框架为AI系统提供了资源理性的心智化决策流程。论文还通过仿真验证和人类-智能体团队实验评估了模型的有效性,并讨论了冲突优化心智化引发的伦理问题。

AI 翻译 · 中文

该论文构建了一个结构因果模型(DAG),将心智理论视为由情境与主体条件激活的机制,而非始终开启的能力。模型包含四个外生变量(如冲突强度、信息可及性)和五个内生中介变量,通过可处理性路径、推理深度路径和使能原因路径三种机制决定心智理论的参与状态。主要输出变量是认知准确性,该框架为AI系统提供了资源理性的心智化决策流程。论文还通过仿真验证和人类-智能体团队实验评估了模型的有效性,并讨论了冲突优化心智化引发的伦理问题。

arXiv cs.AITheory of mind (ToM), the capacity to ascribe mental states to others and use those ascriptions for prediction and inference, is widely assumed to be essential for effective human-machine integration. Existing AI-ToM mod