11:20arXiv cs.AI@Jiangwang Chen, Bowen Zhang, Zixin Song, Jiazheng Kang, Xiao Yang, Da Zhu, Guanjun Jiang精选当前大语言模型对话系统本质上是反应式的,只能在用户输入后响应。OnePred 提出通过递归更新的意图记忆来预测用户下一轮查询,无需重读完整对话历史。该方法采用两阶段强化学习训练,先教模型预测什么,再教如何压缩,形成面向预测的意图链。作者还发布了 NQP-Bench 基准测试集,包含三个子集。实验显示,OnePred 将每轮 token 消耗降低最多 22 倍,同时预测质量优于所有基线,在长对话中优势更明显。论文对话系统预测模型强化学习意图记忆NQP-Bench推荐理由:对话系统从反应式走向主动式的关键一步,做对话 AI 或智能客服的团队值得关注,OnePred 的递归记忆思路可以直接参考或复现。原文