Role-Agent：通过双角色演进让LLM智能体自我进化

精选理由

做 LLM 智能体训练的团队终于有了一个无需外部环境反馈的自我进化方案——Role-Agent 让模型自己当裁判和教练，平均提效 4%+，值得在复杂任务场景中试试。

AI 摘要

Role-Agent 是一种让单个 LLM 同时扮演智能体和环境的框架，通过自举式协同进化提升性能。它包含两个核心组件：World-In-Agent（WIA）让模型在每次行动后预测未来状态，利用预测与实际状态的对齐作为过程奖励，促进环境感知推理；Agent-In-World（AIW）则分析失败轨迹中的模式，并检索具有相似失败模式的任务，重新调整训练数据分布进行针对性练习。在多个基准测试中，Role-Agent 平均提升超过 4%，解决了传统智能体学习依赖低效交互反馈和静态训练环境的问题。

AI 翻译 · 中文

arXiv cs.AIAlthough Large Language Model (LLM) agents have demonstrated strong performance on complex tasks, their learning is often limited by inefficient interaction feedback and static training environments, which hinder broader…

阅读原文