10:41arXiv cs.LG@Tianyi Men, Zhuoran Jin, Pengfei Cao, Yubo Chen, Kang Liu, Jun Zhao该论文提出PEEU方法,通过自主环境探索发现经验并利用事后经验生成严格对齐的高层训练数据。7B模型在真实基准上达到30.6%准确率,超越Qwen2.5-VL-32B。作者提出TDHAF框架分析任务分解的组成性泛化,发现低层原子技能掌握不保证高层规划能力,而高层任务训练对OOD泛化更关键。论文GUI智能体任务规划PEEU多模态语言模型泛化推荐理由:这篇让7B小模型在GUI任务规划上超过32B大模型,还分析了不同层级任务泛化的差异,很实用。原文