02:37AK@_akhaliq阿里发布Qwen-AgentWorld,一个基于Qwen的语言世界模型,专为通用智能体设计。该模型旨在帮助智能体理解环境动态并做出决策。目前尚未公开具体的基准测试结果或性能数据。AI模型Qwen-AgentWorldQwen阿里智能体世界模型推荐理由:阿里出了AgentWorld世界模型,让智能体能更好地理解环境,做Agent开发的朋友可以关注一下。原文
00:49berryxia@berryxia77°Qwen团队直接训练了一个语言世界模型Qwen-AgentWorld,核心目标是从头建模环境而非仅训练Agent行为。模型需预测终端输出、网页变化及代码执行后状态,而非单纯学习操作。利用该模型作为模拟器进行可控Sim RL,在某些任务上模拟训练的Agent性能甚至超过真实环境训练的Agent。此外,仅做环境预测的预训练能力可直接迁移到多轮Agent任务,在多个benchmark上取得显著提升,包括未见领域。Qwen开源了35B MoE版本及对应基准。AI模型QwenQwen-AgentWorld世界模型Agent强化学习推荐理由:通义千问出了个新模型,不是教Agent怎么动,而是先让模型懂环境变化。用模拟环境练出的Agent反而比真实环境练的还强,还开源了35B版,值得看看。原文
22:39阿里通义 Qwen@Alibaba_Qwen精选71°Qwen-AgentWorld是阿里Qwen团队发布的原生语言世界模型,在单一模型中模拟MCP、搜索、终端、SWE、Web、OS和Android共7种智能体环境。环境建模被设定为训练目标,而非后处理适配。在AgentWorldBench基准上,该模型超越Claude Opus 4.8和GPT-5.4。可控SimRL利用此世界模型作为环境进行强化学习,效果超过在真实环境中训练。仅通过预测环境的预热训练,无需智能体特定微调,预测知识即可零微调迁移至智能体任务。AI模型Qwen-AgentWorld智能体世界模型模拟环境强化学习推荐理由:阿里Qwen造了个能模拟7种环境的AgentWorld,在AgentWorldBench上干掉了Claude和GPT最新版,训练智能体不用真实环境也能更强,零微调迁移呢。原文
11:48IT之家(博客/媒体)76°阿里巴巴千问发布Qwen-AgentWorld,这是首个原生语言世界模型。提供两种规模(35B-A3B与397B-A17B)。模型能同时模拟文本类和GUI类环境,覆盖七大领域。通过三阶段训练(CPT、SFT、RL)构建世界建模能力。在Tool Decathlon、MCPMark和WideSearch基准上验证了可控模拟效果。AgentWorldBench已在Hugging Face发布。AI模型Qwen-AgentWorld阿里千问智能体环境模拟Hugging Face推荐理由:阿里千问发布的这个Qwen-AgentWorld模型,能模拟智能体在七个领域的交互环境,还能当环境模拟器或智能体基础模型,挺有意思的。原文