不确定性分解:让LLM智能体主动寻求澄清

Uncertainty Decomposition for Clarification Seeking in LLM Agents

精选理由

这篇论文给出了一个简单实用的方法,让智能体在任务模糊时主动提问,而非盲目执行。五个大模型上都有提升,值得做Agent的同学看看。

AI 摘要

该论文提出一种基于提示的不确定性分解方法,将动作置信度与请求不确定性分离,使智能体在任务规格模糊时主动请求澄清。作者引入WebShop-Clarification和ALFWorld-Clarification两个基准,其中50%任务故意模糊。在GPT-5.1、DeepSeek-v3.2-exp、GLM-4.7、Qwen3.5-35B、GPT-OSS-120B五个大模型上测试,该方法在ALFWorld-Clarification上的澄清F1比ReAct+UE提升73%,比UAM提升36%。

AI 翻译 · 中文

该论文提出一种基于提示的不确定性分解方法,将动作置信度与请求不确定性分离,使智能体在任务规格模糊时主动请求澄清。作者引入WebShop-Clarification和ALFWorld-Clarification两个基准,其中50%任务故意模糊。在GPT-5.1、DeepSeek-v3.2-exp、GLM-4.7、Qwen3.5-35B、GPT-OSS-120B五个大模型上测试,该方法在ALFWorld-Clarification上的澄清F1比ReAct+UE提升73%,比UAM提升36%。

arXiv: DeepSeekRecent position papers argue that the classical aleatoric/epistemic uncertainty framework is insufficient for interactive large language model (LLM) agents and call for underspecification-aware, decomposed, and communica