全部 AI 动态 · AI 热点

6月17日

09:39

arXiv cs.AI@Bojie Li

PreAct 是一种让计算机使用代理（如屏幕点击、打字）在重复任务上更快的新方法。首次成功时，PreAct 将运行编译为小状态机程序，后续重放直接执行，无需逐步骤调用语言模型，速度提升8.5-13倍。重放时每步检查屏幕状态，若不一致则交回代理处理。在移动、桌面和Web基准上，存储时检查机制确保编译程序可靠，避免错误积累，平均多完成1.75-2.6个任务。

推荐理由：想让你那个傻傻的屏幕操作AI学会重复干活不重来？PreAct把第一次成功步骤变成程序，后面直接快10倍，还不容易翻车。

原文

09:37

arXiv cs.AI@Bochen Yang, Lianlei Shan

精选

PearlVLA提出一种将动作规划调度到VLM潜在空间的新框架，通过将元查询表示分为视觉定位分支和迭代潜在规划分支，利用冻结的潜在世界模型生成未来观测，并经过K轮细化后并行解码动作块。在LIBERO基准上，PearlVLA达到了现有方法中的最佳性能，证明了潜在空间推理在降低延迟的同时提升规划质量的有效性。

AI模型 PearlVLA VLA模型具身智能 LIBERO 动作规划

推荐理由：这篇论文提出了PearlVLA，把动作规划放到了潜在空间里，比传统文本链式推理延迟更低，在LIBERO上刷了SOTA，做具身智能的可以看看。

原文

09:34

Fireworks AI@FireworksAI_HQ

精选71°

GLM 5.2 已在 Fireworks 平台零日上线。该模型拥有 1M token 上下文窗口，定位为编码优先的前沿模型。其性能在 SWE-bench、Terminal-Bench、GPQA 和 AIME 等基准上得到独立验证。Fireworks 在智谱开源模型权重后立即在其基础设施上提供服务。

AI模型 GLM 5.2 Fireworks 智谱推理模型编程助手

推荐理由：Fireworks 第一时间上线了 GLM 5.2，百万 token 上下文很能打，编程基准表现不错，做开发的可以试试。

原文

09:31

arXiv: DeepSeek@Esteban Schafir, Xu Zheng, Hojat Allah Salehi, Zhuomin Chen, Mo Sha, Wei Cheng, Dongsheng Luo

精选

DecoSearch是一个无需训练的Text-to-SQL框架，通过轻量级Schema Selector修剪数据库模式，LLM Judger判断查询是否需要分解为DAG子问题。在BIRD上达到70.53%执行准确率，在Spider上达88.31%，使用DeepSeek作为骨干模型，比训练无关基线消耗少一个数量级的token。该方法还可作为模型无关包装器，一致提升微调后的SQL生成骨干性能。

AI模型 DecoSearch DeepSeek Text-to-SQL 推理模型 RAG

推荐理由：DecoSearch不用训练就能把自然语言转SQL，在BIRD和Spider上准确率分别超70%和88%，比同类方法省十倍token。想提升SQL生成效率可以看看。

原文

09:27

09:27IT之家（博客/媒体）

精选

智谱发布并开源 GLM-5.2 模型，支持 1M 无损上下文。在 Code Arena 盲测中取得全球可用模型第一。在多个长程任务基准上表现介于 Claude Opus 4.7 与 4.8 之间。编程基准上保持开源 SOTA，与 Claude Opus 4.8 可比。已适配华为昇腾、平头哥等国产算力平台，单位 token FLOPs 降至 2.9 倍。

AI模型 GLM-5.2 智谱 Code Arena 开源模型上下文长度

推荐理由：智谱的 GLM-5.2 开源了，1M 上下文还拿了 Code Arena 第一，编程和长任务都强，国产算力也能跑。

原文

08:45

berryxia@berryxia

GLM-5.2 以 MIT 协议免费开源，提供 1M 上下文窗口，重点强化了长程任务的 Agent 能力。在 Coding、Tool use、Reasoning 上相比 GLM-5.1 有明显进步，尤其在需要长时间规划和多步执行的场景。API 价格不变，同时支持 Max 和 High 两种推理模式。社区已在 DeepSWE 等基准上验证其实力，开发者可在本地运行长上下文 Agent。

AI模型 GLM-5.2 开源模型智能体编程助手长上下文

推荐理由：智谱开源了GLM-5.2，MIT协议、1M上下文，编程和Agent任务比上一代强不少，还能本地跑，别错过。

原文

08:16

宝玉@dotey

精选76°

NVIDIA GEAR 实验室联合 CMU、UC Berkeley 发布 ENPIRE 系统，让 AI 编程 agent 在真实物理世界中自主重置场景、判断成败、改进策略并迭代代码，无需人类干预。系统在 pin 脚插入、穿扎带、剪扎带、插 GPU 等高精度任务上达到 99% 成功率（pass@8 标准）。测试了 OpenAI Codex（搭配 GPT-5.5）、Anthropic Claude Code（搭配 Opus 4.7）和月之暗面 Kimi Code（搭配 Kimi K2.6）三个 agent。项目还发现物理 scaling law：8 台机器人并行探索比 1 台或 4 台的研究推进速度快得多。所有代码将开源。

AI模型 ENPIRE NVIDIA GEAR 机器人操控智能体开源模型

推荐理由：NVIDIA 和 CMU 搞了个能自己跑实验的机器人系统，AI agent 操控真实机器人干活，成功率99%，还开源了。

原文

07:25

07:25IT之家（博客/媒体）

83°

英伟达在MLPerf Training 6.0七项基准测试中全部夺魁，Blackwell平台成为唯一全覆盖的提交系统。全新GB300 NVL72相比GB200 NVL72同等规模带来1.6倍训练速度提升。CoreWeave使用基于Spectrum-X以太网的GB300 NVL72系统，在8192块GPU规模下将DeepSeek-V3 671B训练耗时缩短至2.02分钟。本次测试首次引入DeepSeek-V3 671B和GPT-OSS-20B两个MoE工作负载，刷新了大规模训练效率纪录。

AI模型 NVIDIA Blackwell DeepSeek-V3 MLPerf 训练基准

推荐理由：英伟达Blackwell平台在MLPerf上把DeepSeek-V3 671B训练时间压到2分钟，比上代快60%，性能真狠。

原文

06:57

Jim Fan@jimfan

在一项无法在物理世界中被攻破的基准测试中，OpenAI Codex 的表现超越 Anthropic Claude，而 Claude 又优于月之暗面 Kimi。该基准由 @DrJimFan 参与的论文提出，专注于物理世界的真实场景评估。结果显示了各模型在复杂物理任务上的相对排名。

AI模型 Codex Claude Kimi 基准测试物理世界

推荐理由：英伟达科学家发推说他们论文里 Codex 把 Claude 和 Kimi 都干掉了，还是物理世界实测，看看你家模型排第几。

原文

06:28

AK@_akhaliq

Data Journalist Agent是一个能将结构化数据自动转化为多模态报道的智能体，输出包括图表、文本和视频。它内置事实核查机制，每一条数据均可追溯原始来源。这个智能体旨在提升数据新闻的生产效率和可信度。

AI模型 Data Journalist Agent 智能体多模态数据新闻事实核查

推荐理由：这个Data Journalist Agent能自动把数据做成带验证的图文视频报道，做数据新闻的不用手动整合多模态了

原文

06:04

NVIDIA AI@NVIDIAAI

73°

NVIDIA Research 推出 SpatialClaw，一个无需训练的智能体，通过编写 Python 代码作为动作接口。它在持久内核中动态组合感知模块，检查中间结果并跨步骤调整策略。感知输出作为普通变量，可结合 NumPy、SciPy 等库复用。SpatialClaw 在 20 个基准上平均比先前方法高 11.2 分，在 6 种不同模型骨干上表现稳定。

AI模型 SpatialClaw NVIDIA 智能体多模态视觉推理

推荐理由：SpatialClaw 不用额外训练，靠写代码搞定复杂视觉任务，在 20 个基准上平均提升 11.2 分，还兼容多种模型。

原文

05:29

elvis@omarsar0

精选

GLM-5.2 (Max)在Code Arena: Frontend榜单中排名第二，得分比Claude Opus 4.7 (Thinking)高29分，仅落后于Fable 5。该模型在React子榜单排第2，HTML排第4，且在品牌营销、参考设计等6个子类别中均位列第一。作为开源模型，GLM-5.2大幅领先Kimi-K2.6和Minimax-M3。

AI模型 GLM-5.2 Code Arena Claude Opus 4.7 Fable 5 编程助手

推荐理由：智谱新模型GLM-5.2 Max在代码前端评测中杀到第二，直接压过Claude Opus 4.7，开源模型里目前最强，做前端开发的可以关注。

原文

05:29

ollama@ollama

GLM-5.2 在 Design Arena 上以 1360 Elo 获得第一名，超过此前领先的 Claude Fable 5。该模型开源权重，排名较此前上升 4 位，Elo 提升 27 分。这使其成为 Design Arena 代码类别历史上最高 Elo 之一。GLM-5.2 由 Zai_org 发布。

AI模型 GLM-5.2 Design Arena Zai_org 开源模型代码生成

推荐理由：GLM-5.2 在代码设计赛上跑了第一，1360 Elo，超过 Claude Fable 5，还开源了，值得试试。

原文

04:50

阿里通义 Qwen@Alibaba_Qwen

76°

阿里Qwen团队推出Qwen-Robot Suite，包含三个基础模型：Qwen-RobotNav统一了5种导航任务（指令跟随、点目标、物体目标、目标跟踪、自动驾驶），支持可控观察协议。Qwen-RobotManip在异构机器人上统一状态-动作空间，预训练于38,100+小时开源语料。Qwen-RobotWorld是世界模型，支持20+种具身形态，通过自然语言接口预测物理未来。三个模型可独立使用或组合为具身智能系统的底层工具包。

AI模型 Qwen-RobotNav Qwen-RobotManip Qwen-RobotWorld 阿里巴巴具身智能

推荐理由：阿里刚发了三款机器人基础模型，导航、操作、世界模型全包了，数据量和工作范围都挺具体，搞具身智能的可以看看。

原文

04:49

阿里通义 Qwen@Alibaba_Qwen

精选72°

Qwen-RobotWorld由阿里巴巴Qwen团队发布，将自然语言视为通用动作接口，统一末端执行器姿态、转向命令和导航点。该模型在具身世界知识语料库（860万视频-文本对、超2亿帧）上联合训练20+种具身类型和500+个动作类别。在EWMBench、DreamGen、WorldModelBench、PBench等基准测试中表现强劲。这一方法桥接了通用视频生成模型与领域专用具身模型之间的鸿沟。

AI模型 Qwen-RobotWorld 阿里巴巴具身智能视频生成基准测试

推荐理由：Qwen把自然语言当遥控器，一个模型搞定机器臂、自动驾驶、无人机等20多种动作，还赢了多个基准，挺有意思。

原文

04:49

阿里通义 Qwen@Alibaba_Qwen

阿里巴巴Qwen团队推出Qwen-Robot Suite，将大语言模型能力扩展到物理世界。该套件使AI能够执行真实的机器人动作，而不仅仅是文本对话。更多演示视频可在官方博客qwen.ai/blog?id=qwen-r...查看。目前该推文获得63个点赞和5812次浏览。

AI模型 Qwen Qwen-Robot Suite 阿里巴巴机器人

推荐理由：Qwen机器人套件让AI从聊天变动手，看看它怎么在现实里干活

原文

04:34

Notion@NotionHQ

Notion 宣布在其平台上推出开放权重模型 GLM 5.2。该模型专门为长周期任务优化，通过 Baseten 提供服务。用户可直接在 Notion 中使用该模型，其权重公开可用于自定义部署。

AI模型 GLM 5.2 Notion Baseten 开放权重模型

推荐理由：Notion 上多了个新模型 GLM 5.2，专搞长周期任务，通过 Baseten 提供服务，想试试开放权重模型的可以看看。

原文

04:28

elvis@omarsar0

GLM-5.2 在 Design Arena 上跃居第一，Elo 评分达 1360，超越了此前不可用的 Claude Fable 5。该模型相比前代提升了 4 个名次和 27 个 Elo 分，创下 Design Arena 代码类别中最高 Elo 记录之一。模型以开放权重发布，由 @Zai_org 团队推出。

AI模型 GLM-5.2 Design Arena 开源模型设计能力

推荐理由：智谱的 GLM-5.2 刚把 Claude Fable 5 挤下 Design Arena 榜首，开放权重还能自己测，设计能力拉满。

原文

04:01

elvis@omarsar0

GLM 5.2 在 FrontierSWE 基准上排名第 3，得分仅次于 Fable 5 和 Opus 4.8，并超越 GPT-5.5。这是首个缩小 Anthropic/OpenAI 与其他提供商之间差距的模型，同时也是目前最强的开源权重模型。该成绩展示了开源模型在编码任务上的竞争力。

AI模型 GLM 5.2 FrontierSWE GPT-5.5 开源模型编码基准

推荐理由：GLM 5.2 在编码基准上干掉了 GPT-5.5，开源里最强，值得关注。

原文

04:01

elvis@omarsar0

72°

Z.ai 宣布推出 GLM-5.2 开源权重模型，MIT 许可发布。其在编码和智能体任务上有显著改进，支持 1M 上下文窗口。提供两种推理等级：GLM-5.2 (max) 和 GLM-5.2 (high)，后者在性能与 token 效率间取得平衡。API 定价与 GLM-5.1 相同，权重已上架 Hugging Face。

AI模型 GLM-5.2 Z.ai 开源模型编码智能体长上下文

推荐理由：Z.ai 发了 GLM-5.2，开源权重、MIT 许可，编码和智能体能力提升明显，还支持 1M 上下文，想玩前沿模型的可以试试。

原文

03:58

lmarena.ai@lmarena_ai

GLM-5.2 (Max) 在 Text Arena 总榜排名第25位，与上一版本 GLM-5.1 水平接近。在 Expert Arena 和 Multi-Turn 子类别中取得较大进步。在生命科学、社会科学、创意写作和医学医疗等职业类别中表现提升。

AI模型 GLM-5.2 GLM-5.1 智谱 Text Arena 多轮对话

推荐理由：智谱新模型 GLM-5.2 整体排名没变，但在专家问答和多轮对话上进步明显，写创意和医学内容更强了。

原文

03:49

ollama@ollama

精选

Z.ai 发布 GLM-5.2，支持 1M token 上下文窗口，专为长程编码和智能体任务设计。提供两种推理模式：GLM-5.2 (max) 和 GLM-5.2 (high)，权重以 MIT 许可开源。现已通过 Ollama 云服务在美国 NVIDIA Blackwell GPU 上可用，API 定价与 GLM-5.1 相同。该模型声称是目前最强开源编码模型。

AI模型 GLM-5.2 Z.ai Ollama 开源模型长上下文

推荐理由：Z.ai 开源了 GLM-5.2，有 1M 上下文窗口，适合写长代码和搭智能体，在 Ollama 上直接就能用，MIT 许可随便玩。

原文

03:46

lmarena.ai@lmarena_ai

76°

GLM-5.2 (Max) 在 Code Arena: Frontend 中排名第二，得分比 Claude Opus 4.7 (Thinking) 高 29 分，仅次于 Fable 5。在 Agent Arena 中排名第 10，是排名最高的开源模型，超越 Kimi-K2.6 和 Minimax-M3。在 Brand & Marketing、Reference-Based Design 等 6 个子类别中均排名第一。价格维持 $1.4/$4.4 per input/output MTokens，上下文窗口 1M。与 5.1 相比，排名从 #13 升至 #10，任务成功率和用户评价提升，但 steerability 下降 6%。

AI模型 GLM-5.2 Zai_org Code Arena Agent Arena 开源模型

推荐理由：GLM-5.2 在编程和智能体任务上超越 Claude Opus 4.7，是开源模型新标杆，编程能力仅次于 Fable 5。

原文

03:40

@koltregaskes@koltregaskes

OpenAI即将推出新语音模型GPT-Bidi-1（代号可能变更）。该模型专为生成更自然的语音交互设计。消息最早由Dev Mode服务器报道，目前无具体发布日期。

AI模型 GPT-Bidi-1 OpenAI 语音模型自然语音

推荐理由：OpenAI要发新语音模型GPT-Bidi-1，听说声音超级自然，比现在的好不少！

原文

03:38

@koltregaskes@koltregaskes

DeepSeek 4.1 版本预计于本周发布。该版本是 DeepSeek 系列的最新迭代，具体性能数据尚未公布。用户可关注官方渠道获取更新信息。

AI模型 DeepSeek DeepSeek 4.1 模型发布开源模型

推荐理由：DeepSeek 要发新版本了，听说这周就上线，看看有什么进步。

原文

03:37

The Rundown AI@therundownai

73°

Z AI发布了GLM-5.2，一款开源权重模型，支持1M token上下文窗口。在long-horizon coding基准上得分为74.4，超过GPT-5.5的72.6。在SWE-bench Pro上得分为62.1，同样领先GPT-5.5。AIME 2026数学测试得分为99.2，高于Opus 4.8和GPT-5.5。该模型在Designarena排名第一，并以MIT许可证发布。

AI模型 GLM-5.2 Z AI Opus 4.8 GPT-5.5 开源模型

推荐理由：Z AI的GLM-5.2开源，百万token上下文，数学和编程全面超过GPT-5.5，值得试玩。

原文

03:35

@koltregaskes@koltregaskes

AI模型 Fable 5 模型排行榜基准测试

推荐理由：Fable 5 在排行榜上把其他模型都压下去了，看看它到底强在哪

原文

03:28

lmarena.ai@lmarena_ai

Agent Arena 是一个智能体性能排行榜，现已在 arena.ai/leaderboard/ag... 上线。用户可通过按开放模型或按实验室（lab）筛选来查看详细数据。该排行榜为不同智能体模型提供了直接的性能对比基准。

AI模型 Agent Arena 智能体排行榜基准测试开放模型

推荐理由：想比对比不同智能体模型？去Agent Arena排行榜，能按开放模型或实验室筛选，帮你找到合适的。

原文

03:05

vLLM@vllm_project

精选

vLLM 发布 0.23.0 版本，为 Zai.org 的 GLM-5.2 模型提供 Day-0 支持。GLM-5.2 拥有 1M token 上下文窗口，专为长周期编码智能体设计，可承载从需求到部署的完整开发流程。该模型针对大规模代码实现、自动化研究和性能优化进行了调优，支持客户端和移动端内调试。用户即日起可通过 vLLM 运行该模型。

AI模型 vLLM GLM-5.2 1M token 编程助手推理模型

推荐理由：vLLM 刚发的 0.23.0 直接支持了 GLM-5.2，这个模型有 100 万 token 上下文，适合一口气写完整个项目代码，还能跨平台部署，写代码的可以试试。

原文

03:05

OpenRouter@OpenRouterAI

精选

智谱AI的GLM-5.2模型已在OpenRouter平台上线。该模型拥有100万token的上下文窗口。它专为长周期、混乱的编码代理任务设计，能保持可靠性。

AI模型 GLM-5.2 Z.ai OpenRouter 超长上下文智能体

推荐理由：GLM-5.2在OpenRouter上架了，百万级上下文处理复杂编码任务，适合做长周期智能体。

原文

03:04

OpenRouter@OpenRouterAI

精选

Z.ai 发布 GLM-5.2 模型，采用 MIT 开源许可。该模型在编码和智能体任务上有显著提升，支持最长 1M 标记的上下文窗口。提供两种推理强度：GLM-5.2 (max) 追求极限性能，GLM-5.2 (high) 平衡性能与 token 效率。API 定价与 GLM-5.1 保持一致。

AI模型 GLM-5.2 Z.ai 开源模型编码助手智能体

推荐理由：Z.ai 新出的 GLM-5.2 模型，编码和智能体能力大幅增强，还有 1M 超大上下文，而且开源！API 价格没涨，值得试试。

原文

03:03

berryxia@berryxia

73°

NVIDIA开源了SOMA-X v0.2，一个使用单一骨架就能适配各种体型的3D人体模型。该模型具备关节扭转自动修正、骨骼自动缩放、高级姿态反转和超轻量数据特性，采用Apache 2.0许可证。它专为机器人和物理AI设计，可用于机器人训练、物理仿真和动作迁移，解决了不同机器人体型不统一导致动作数据难以复用的问题。

AI模型 SOMA-X NVIDIA 3D人体模型机器人物理AI

推荐理由：NVIDIA开源了SOMA-X v0.2，单一骨架就能适配不同体型，机器人动作数据复用门槛降低，训练效率提升。

原文

03:01

lmarena.ai@lmarena_ai

精选72°

GLM-5.2 (Max) 在 Agent Arena 排行榜上排名第10，得分接近 Claude-Opus-4.8（非推理模式）。它成为排名最高的开源模型，较去年发布的 GLM-5.1 从第13位上升3位。该模型在数百万真实长程任务上评测，可调用网页搜索、文件系统和终端工具。GLM-5.2 (Max) 输入/输出定价保持为每百万 token 1.4/4.4 美元，支持1M上下文窗口，权重采用 MIT 许可开源。

AI模型 GLM-5.2 Zai_org Agent Arena 开源模型智能体

推荐理由：Zai_org 发了 GLM-5.2，在 Agent 任务榜单上排第10，碾压所有开源模型，而且价格没变。跑复杂工作流、调工具效果明显进步。

原文

02:29

02:29Google Research: Blog（资讯）

Google Research 推出 Earth AI 机器学习模型，通过分析高分辨率卫星图像识别土地覆盖类型与植被健康度，支持生态恢复项目的规划与监测。该模型在 Global Land Cover 数据集上训练，覆盖 10 米分辨率地表信息，并已在巴西、澳大利亚等地测试。Google 还开源了相关模型与数据集，供研究社区使用。

AI模型 Earth AI Google 开源模型卫星图像生态恢复

推荐理由：Google 用 AI 看卫星图帮你规划种树恢复生态，模型和数据集都开源了，想做生态项目可以试试

原文

02:17

kimmonismus@kimmonismus

77°

GLM-5.2 以 MIT 许可证开源，权重开放。该模型支持 1M token 上下文窗口。提供 max 和 high 两种推理模式。专门针对大规模部署、自动化研究、性能优化和复杂调试进行训练。API 定价与 GLM-5.1 保持一致。

AI模型 GLM-5.2 智谱开源模型长上下文推理模型

推荐理由：智谱开源了 GLM-5.2，1M 上下文还能选推理模式，做长代码任务更强了。

原文

01:59

lmarena.ai@lmarena_ai

Agent Arena 在其官方博客中介绍了用于智能体评估的因果追踪方法论。该方法可帮助研究人员分析智能体决策背后的因果链路。Agent Arena 平台本身支持多种智能体基准测试。

AI模型 Agent Arena 智能体评估基准因果追踪

推荐理由：Agent Arena 的因果追踪方法能帮你搞懂智能体为什么那么做，比单纯看分数更有用。

原文

01:57

Jim Fan@jimfan

76°

NVIDIA联合CMU和伯克利推出ENPIRE系统，让AI智能体完全自主控制真实机器人循环，包括重置环境、搜索文献、实现想法、训练部署、自我验证等步骤。该系统在整理别针、安装GPU、绑扎带等灵巧任务上达到99%成功率。机器人通过自提出启发式成功信号进行爬坡优化，无需人类介入。

AI模型 ENPIRE NVIDIA 机器人智能体自主循环

推荐理由：NVIDIA搞了个ENPIRE，让AI自己操控机器人反复试错，真实任务成功率干到99%，连GPU都能自己插。

原文

01:31

lmarena.ai@lmarena_ai

精选

MiniMax M3 在全新 Agent Arena 排行榜上位列第18，是排名第5的开源模型。相比 M2.7，M3 从第22名升至第18名，主要改进是任务成功确认和 bash 错误恢复能力。工具幻觉保持低位，与最佳模型并列第一。排行榜基于30万+任务、200万+工具调用和4000万行代码的代理会话评估。

AI模型 MiniMax M3 Agent Arena 开源模型智能体

推荐理由：MiniMax M3 在 Agent Arena 上排名上升了4位，是最强开源模型之一，能写代码、做PPT、查资料，幻觉控制也顶级。

原文

00:59

AK@_akhaliq

JoyAI发布了JoyAI-VL-Interaction模型，这是一个实时视觉语言交互智能系统。该模型支持实时视觉理解与语言生成，能够处理视频帧序列并生成自然语言响应。目前尚未公布具体基准测试成绩或版本号。

AI模型 JoyAI-VL-Interaction JoyAI 多模态实时交互

推荐理由：JoyAI出了个能实时看懂画面并跟你聊天的模型，适合做交互式AI应用。

原文

00:55

marktechpost@Asif Razzaq

精选73°

Qwen团队推出Qwen-RobotSuite，包含三个具身AI模型。RobotManip是基于Qwen3.5-4B的视觉-语言-动作模型，用于操作任务。RobotWorld是一个60层MMDiT架构的语言条件视频世界模型。RobotNav是基于Qwen3-VL的导航模型，提供2B、4B和8B三种参数量。

AI模型 Qwen-RobotSuite RobotManip RobotWorld RobotNav 具身AI

推荐理由：一口气发了三个模型，从操作到导航都管了，全用自家Qwen3.5和Qwen3-VL，做机器人研究的可以看看。

原文