09:39arXiv cs.AI@Bojie LiPreAct 是一种让计算机使用代理(如屏幕点击、打字)在重复任务上更快的新方法。首次成功时,PreAct 将运行编译为小状态机程序,后续重放直接执行,无需逐步骤调用语言模型,速度提升8.5-13倍。重放时每步检查屏幕状态,若不一致则交回代理处理。在移动、桌面和Web基准上,存储时检查机制确保编译程序可靠,避免错误积累,平均多完成1.75-2.6个任务。AI模型PreActComputer-Using Agents智能体效率优化推荐理由:想让你那个傻傻的屏幕操作AI学会重复干活不重来?PreAct把第一次成功步骤变成程序,后面直接快10倍,还不容易翻车。原文
09:37arXiv cs.AI@Bochen Yang, Lianlei Shan精选PearlVLA提出一种将动作规划调度到VLM潜在空间的新框架,通过将元查询表示分为视觉定位分支和迭代潜在规划分支,利用冻结的潜在世界模型生成未来观测,并经过K轮细化后并行解码动作块。在LIBERO基准上,PearlVLA达到了现有方法中的最佳性能,证明了潜在空间推理在降低延迟的同时提升规划质量的有效性。AI模型PearlVLAVLA模型具身智能LIBERO动作规划推荐理由:这篇论文提出了PearlVLA,把动作规划放到了潜在空间里,比传统文本链式推理延迟更低,在LIBERO上刷了SOTA,做具身智能的可以看看。原文
09:34Fireworks AI@FireworksAI_HQ精选71°GLM 5.2 已在 Fireworks 平台零日上线。该模型拥有 1M token 上下文窗口,定位为编码优先的前沿模型。其性能在 SWE-bench、Terminal-Bench、GPQA 和 AIME 等基准上得到独立验证。Fireworks 在智谱开源模型权重后立即在其基础设施上提供服务。AI模型GLM 5.2Fireworks智谱推理模型编程助手1 个信源在谈推荐理由:Fireworks 第一时间上线了 GLM 5.2,百万 token 上下文很能打,编程基准表现不错,做开发的可以试试。原文
09:31arXiv: DeepSeek@Esteban Schafir, Xu Zheng, Hojat Allah Salehi, Zhuomin Chen, Mo Sha, Wei Cheng, Dongsheng Luo精选DecoSearch是一个无需训练的Text-to-SQL框架,通过轻量级Schema Selector修剪数据库模式,LLM Judger判断查询是否需要分解为DAG子问题。在BIRD上达到70.53%执行准确率,在Spider上达88.31%,使用DeepSeek作为骨干模型,比训练无关基线消耗少一个数量级的token。该方法还可作为模型无关包装器,一致提升微调后的SQL生成骨干性能。AI模型DecoSearchDeepSeekText-to-SQL推理模型RAG推荐理由:DecoSearch不用训练就能把自然语言转SQL,在BIRD和Spider上准确率分别超70%和88%,比同类方法省十倍token。想提升SQL生成效率可以看看。原文
09:27IT之家(博客/媒体)精选智谱发布并开源 GLM-5.2 模型,支持 1M 无损上下文。在 Code Arena 盲测中取得全球可用模型第一。在多个长程任务基准上表现介于 Claude Opus 4.7 与 4.8 之间。编程基准上保持开源 SOTA,与 Claude Opus 4.8 可比。已适配华为昇腾、平头哥等国产算力平台,单位 token FLOPs 降至 2.9 倍。AI模型GLM-5.2智谱Code Arena开源模型上下文长度推荐理由:智谱的 GLM-5.2 开源了,1M 上下文还拿了 Code Arena 第一,编程和长任务都强,国产算力也能跑。原文
08:45berryxia@berryxiaGLM-5.2 以 MIT 协议免费开源,提供 1M 上下文窗口,重点强化了长程任务的 Agent 能力。在 Coding、Tool use、Reasoning 上相比 GLM-5.1 有明显进步,尤其在需要长时间规划和多步执行的场景。API 价格不变,同时支持 Max 和 High 两种推理模式。社区已在 DeepSWE 等基准上验证其实力,开发者可在本地运行长上下文 Agent。AI模型GLM-5.2开源模型智能体编程助手长上下文推荐理由:智谱开源了GLM-5.2,MIT协议、1M上下文,编程和Agent任务比上一代强不少,还能本地跑,别错过。原文
08:16宝玉@dotey精选76°NVIDIA GEAR 实验室联合 CMU、UC Berkeley 发布 ENPIRE 系统,让 AI 编程 agent 在真实物理世界中自主重置场景、判断成败、改进策略并迭代代码,无需人类干预。系统在 pin 脚插入、穿扎带、剪扎带、插 GPU 等高精度任务上达到 99% 成功率(pass@8 标准)。测试了 OpenAI Codex(搭配 GPT-5.5)、Anthropic Claude Code(搭配 Opus 4.7)和月之暗面 Kimi Code(搭配 Kimi K2.6)三个 agent。项目还发现物理 scaling law:8 台机器人并行探索比 1 台或 4 台的研究推进速度快得多。所有代码将开源。AI模型ENPIRENVIDIA GEAR机器人操控智能体开源模型10 个信源在谈推荐理由:NVIDIA 和 CMU 搞了个能自己跑实验的机器人系统,AI agent 操控真实机器人干活,成功率99%,还开源了。原文
07:25IT之家(博客/媒体)83°英伟达在MLPerf Training 6.0七项基准测试中全部夺魁,Blackwell平台成为唯一全覆盖的提交系统。全新GB300 NVL72相比GB200 NVL72同等规模带来1.6倍训练速度提升。CoreWeave使用基于Spectrum-X以太网的GB300 NVL72系统,在8192块GPU规模下将DeepSeek-V3 671B训练耗时缩短至2.02分钟。本次测试首次引入DeepSeek-V3 671B和GPT-OSS-20B两个MoE工作负载,刷新了大规模训练效率纪录。AI模型NVIDIABlackwellDeepSeek-V3MLPerf训练基准9 个信源在谈推荐理由:英伟达Blackwell平台在MLPerf上把DeepSeek-V3 671B训练时间压到2分钟,比上代快60%,性能真狠。原文
06:57Jim Fan@jimfan在一项无法在物理世界中被攻破的基准测试中,OpenAI Codex 的表现超越 Anthropic Claude,而 Claude 又优于月之暗面 Kimi。该基准由 @DrJimFan 参与的论文提出,专注于物理世界的真实场景评估。结果显示了各模型在复杂物理任务上的相对排名。AI模型CodexClaudeKimi基准测试物理世界10 个信源在谈推荐理由:英伟达科学家发推说他们论文里 Codex 把 Claude 和 Kimi 都干掉了,还是物理世界实测,看看你家模型排第几。原文
06:28AK@_akhaliqData Journalist Agent是一个能将结构化数据自动转化为多模态报道的智能体,输出包括图表、文本和视频。它内置事实核查机制,每一条数据均可追溯原始来源。这个智能体旨在提升数据新闻的生产效率和可信度。AI模型Data Journalist Agent智能体多模态数据新闻事实核查推荐理由:这个Data Journalist Agent能自动把数据做成带验证的图文视频报道,做数据新闻的不用手动整合多模态了原文
06:04NVIDIA AI@NVIDIAAI73°NVIDIA Research 推出 SpatialClaw,一个无需训练的智能体,通过编写 Python 代码作为动作接口。它在持久内核中动态组合感知模块,检查中间结果并跨步骤调整策略。感知输出作为普通变量,可结合 NumPy、SciPy 等库复用。SpatialClaw 在 20 个基准上平均比先前方法高 11.2 分,在 6 种不同模型骨干上表现稳定。AI模型SpatialClawNVIDIA智能体多模态视觉推理8 个信源在谈推荐理由:SpatialClaw 不用额外训练,靠写代码搞定复杂视觉任务,在 20 个基准上平均提升 11.2 分,还兼容多种模型。原文
05:29elvis@omarsar0精选GLM-5.2 (Max)在Code Arena: Frontend榜单中排名第二,得分比Claude Opus 4.7 (Thinking)高29分,仅落后于Fable 5。该模型在React子榜单排第2,HTML排第4,且在品牌营销、参考设计等6个子类别中均位列第一。作为开源模型,GLM-5.2大幅领先Kimi-K2.6和Minimax-M3。AI模型GLM-5.2Code ArenaClaude Opus 4.7Fable 5编程助手10 个信源在谈推荐理由:智谱新模型GLM-5.2 Max在代码前端评测中杀到第二,直接压过Claude Opus 4.7,开源模型里目前最强,做前端开发的可以关注。原文
05:29ollama@ollamaGLM-5.2 在 Design Arena 上以 1360 Elo 获得第一名,超过此前领先的 Claude Fable 5。该模型开源权重,排名较此前上升 4 位,Elo 提升 27 分。这使其成为 Design Arena 代码类别历史上最高 Elo 之一。GLM-5.2 由 Zai_org 发布。AI模型GLM-5.2Design ArenaZai_org开源模型代码生成3 个信源在谈推荐理由:GLM-5.2 在代码设计赛上跑了第一,1360 Elo,超过 Claude Fable 5,还开源了,值得试试。原文
04:50阿里通义 Qwen@Alibaba_Qwen76°阿里Qwen团队推出Qwen-Robot Suite,包含三个基础模型:Qwen-RobotNav统一了5种导航任务(指令跟随、点目标、物体目标、目标跟踪、自动驾驶),支持可控观察协议。Qwen-RobotManip在异构机器人上统一状态-动作空间,预训练于38,100+小时开源语料。Qwen-RobotWorld是世界模型,支持20+种具身形态,通过自然语言接口预测物理未来。三个模型可独立使用或组合为具身智能系统的底层工具包。AI模型Qwen-RobotNavQwen-RobotManipQwen-RobotWorld阿里巴巴具身智能推荐理由:阿里刚发了三款机器人基础模型,导航、操作、世界模型全包了,数据量和工作范围都挺具体,搞具身智能的可以看看。原文
04:49阿里通义 Qwen@Alibaba_Qwen精选72°Qwen-RobotWorld由阿里巴巴Qwen团队发布,将自然语言视为通用动作接口,统一末端执行器姿态、转向命令和导航点。该模型在具身世界知识语料库(860万视频-文本对、超2亿帧)上联合训练20+种具身类型和500+个动作类别。在EWMBench、DreamGen、WorldModelBench、PBench等基准测试中表现强劲。这一方法桥接了通用视频生成模型与领域专用具身模型之间的鸿沟。AI模型Qwen-RobotWorld阿里巴巴具身智能视频生成基准测试推荐理由:Qwen把自然语言当遥控器,一个模型搞定机器臂、自动驾驶、无人机等20多种动作,还赢了多个基准,挺有意思。原文
04:49阿里通义 Qwen@Alibaba_Qwen阿里巴巴Qwen团队推出Qwen-Robot Suite,将大语言模型能力扩展到物理世界。该套件使AI能够执行真实的机器人动作,而不仅仅是文本对话。更多演示视频可在官方博客qwen.ai/blog?id=qwen-r...查看。目前该推文获得63个点赞和5812次浏览。AI模型QwenQwen-Robot Suite阿里巴巴机器人推荐理由:Qwen机器人套件让AI从聊天变动手,看看它怎么在现实里干活原文
04:34Notion@NotionHQNotion 宣布在其平台上推出开放权重模型 GLM 5.2。该模型专门为长周期任务优化,通过 Baseten 提供服务。用户可直接在 Notion 中使用该模型,其权重公开可用于自定义部署。AI模型GLM 5.2NotionBaseten开放权重模型1 个信源在谈推荐理由:Notion 上多了个新模型 GLM 5.2,专搞长周期任务,通过 Baseten 提供服务,想试试开放权重模型的可以看看。原文
04:28elvis@omarsar0GLM-5.2 在 Design Arena 上跃居第一,Elo 评分达 1360,超越了此前不可用的 Claude Fable 5。该模型相比前代提升了 4 个名次和 27 个 Elo 分,创下 Design Arena 代码类别中最高 Elo 记录之一。模型以开放权重发布,由 @Zai_org 团队推出。AI模型GLM-5.2Design Arena开源模型设计能力2 个信源在谈推荐理由:智谱的 GLM-5.2 刚把 Claude Fable 5 挤下 Design Arena 榜首,开放权重还能自己测,设计能力拉满。原文
04:01elvis@omarsar0GLM 5.2 在 FrontierSWE 基准上排名第 3,得分仅次于 Fable 5 和 Opus 4.8,并超越 GPT-5.5。这是首个缩小 Anthropic/OpenAI 与其他提供商之间差距的模型,同时也是目前最强的开源权重模型。该成绩展示了开源模型在编码任务上的竞争力。AI模型GLM 5.2FrontierSWEGPT-5.5开源模型编码基准10 个信源在谈推荐理由:GLM 5.2 在编码基准上干掉了 GPT-5.5,开源里最强,值得关注。原文
04:01elvis@omarsar072°Z.ai 宣布推出 GLM-5.2 开源权重模型,MIT 许可发布。其在编码和智能体任务上有显著改进,支持 1M 上下文窗口。提供两种推理等级:GLM-5.2 (max) 和 GLM-5.2 (high),后者在性能与 token 效率间取得平衡。API 定价与 GLM-5.1 相同,权重已上架 Hugging Face。AI模型GLM-5.2Z.ai开源模型编码智能体长上下文推荐理由:Z.ai 发了 GLM-5.2,开源权重、MIT 许可,编码和智能体能力提升明显,还支持 1M 上下文,想玩前沿模型的可以试试。原文
03:58lmarena.ai@lmarena_aiGLM-5.2 (Max) 在 Text Arena 总榜排名第25位,与上一版本 GLM-5.1 水平接近。在 Expert Arena 和 Multi-Turn 子类别中取得较大进步。在生命科学、社会科学、创意写作和医学医疗等职业类别中表现提升。AI模型GLM-5.2GLM-5.1智谱Text Arena多轮对话推荐理由:智谱新模型 GLM-5.2 整体排名没变,但在专家问答和多轮对话上进步明显,写创意和医学内容更强了。原文
03:49ollama@ollama精选Z.ai 发布 GLM-5.2,支持 1M token 上下文窗口,专为长程编码和智能体任务设计。提供两种推理模式:GLM-5.2 (max) 和 GLM-5.2 (high),权重以 MIT 许可开源。现已通过 Ollama 云服务在美国 NVIDIA Blackwell GPU 上可用,API 定价与 GLM-5.1 相同。该模型声称是目前最强开源编码模型。AI模型GLM-5.2Z.aiOllama开源模型长上下文10 个信源在谈推荐理由:Z.ai 开源了 GLM-5.2,有 1M 上下文窗口,适合写长代码和搭智能体,在 Ollama 上直接就能用,MIT 许可随便玩。原文
03:46lmarena.ai@lmarena_ai76°GLM-5.2 (Max) 在 Code Arena: Frontend 中排名第二,得分比 Claude Opus 4.7 (Thinking) 高 29 分,仅次于 Fable 5。在 Agent Arena 中排名第 10,是排名最高的开源模型,超越 Kimi-K2.6 和 Minimax-M3。在 Brand & Marketing、Reference-Based Design 等 6 个子类别中均排名第一。价格维持 $1.4/$4.4 per input/output MTokens,上下文窗口 1M。与 5.1 相比,排名从 #13 升至 #10,任务成功率和用户评价提升,但 steerability 下降 6%。AI模型GLM-5.2Zai_orgCode ArenaAgent Arena开源模型3 个信源在谈推荐理由:GLM-5.2 在编程和智能体任务上超越 Claude Opus 4.7,是开源模型新标杆,编程能力仅次于 Fable 5。原文
03:40@koltregaskes@koltregaskesOpenAI即将推出新语音模型GPT-Bidi-1(代号可能变更)。该模型专为生成更自然的语音交互设计。消息最早由Dev Mode服务器报道,目前无具体发布日期。AI模型GPT-Bidi-1OpenAI语音模型自然语音10 个信源在谈推荐理由:OpenAI要发新语音模型GPT-Bidi-1,听说声音超级自然,比现在的好不少!原文
03:38@koltregaskes@koltregaskesDeepSeek 4.1 版本预计于本周发布。该版本是 DeepSeek 系列的最新迭代,具体性能数据尚未公布。用户可关注官方渠道获取更新信息。AI模型DeepSeekDeepSeek 4.1模型发布开源模型推荐理由:DeepSeek 要发新版本了,听说这周就上线,看看有什么进步。原文
03:37The Rundown AI@therundownai73°Z AI发布了GLM-5.2,一款开源权重模型,支持1M token上下文窗口。在long-horizon coding基准上得分为74.4,超过GPT-5.5的72.6。在SWE-bench Pro上得分为62.1,同样领先GPT-5.5。AIME 2026数学测试得分为99.2,高于Opus 4.8和GPT-5.5。该模型在Designarena排名第一,并以MIT许可证发布。AI模型GLM-5.2Z AIOpus 4.8GPT-5.5开源模型6 个信源在谈推荐理由:Z AI的GLM-5.2开源,百万token上下文,数学和编程全面超过GPT-5.5,值得试玩。原文
03:35@koltregaskes@koltregaskesFable 5 在多个模型排行榜上表现突出,相较此前版本实现罕见的大幅提升。该模型在多项基准测试中显著碾压其他对手,但不是在所有任务上都优秀。这一成绩引发对 OpenAI 等竞争者如何应对的讨论。AI模型Fable 5模型排行榜基准测试10 个信源在谈推荐理由:Fable 5 在排行榜上把其他模型都压下去了,看看它到底强在哪原文
03:28lmarena.ai@lmarena_aiAgent Arena 是一个智能体性能排行榜,现已在 arena.ai/leaderboard/ag... 上线。用户可通过按开放模型或按实验室(lab)筛选来查看详细数据。该排行榜为不同智能体模型提供了直接的性能对比基准。AI模型Agent Arena智能体排行榜基准测试开放模型推荐理由:想比对比不同智能体模型?去Agent Arena排行榜,能按开放模型或实验室筛选,帮你找到合适的。原文
03:05vLLM@vllm_project精选vLLM 发布 0.23.0 版本,为 Zai.org 的 GLM-5.2 模型提供 Day-0 支持。GLM-5.2 拥有 1M token 上下文窗口,专为长周期编码智能体设计,可承载从需求到部署的完整开发流程。该模型针对大规模代码实现、自动化研究和性能优化进行了调优,支持客户端和移动端内调试。用户即日起可通过 vLLM 运行该模型。AI模型vLLMGLM-5.21M token编程助手推理模型推荐理由:vLLM 刚发的 0.23.0 直接支持了 GLM-5.2,这个模型有 100 万 token 上下文,适合一口气写完整个项目代码,还能跨平台部署,写代码的可以试试。原文
03:05OpenRouter@OpenRouterAI精选智谱AI的GLM-5.2模型已在OpenRouter平台上线。该模型拥有100万token的上下文窗口。它专为长周期、混乱的编码代理任务设计,能保持可靠性。AI模型GLM-5.2Z.aiOpenRouter超长上下文智能体推荐理由:GLM-5.2在OpenRouter上架了,百万级上下文处理复杂编码任务,适合做长周期智能体。原文
03:04OpenRouter@OpenRouterAI精选Z.ai 发布 GLM-5.2 模型,采用 MIT 开源许可。该模型在编码和智能体任务上有显著提升,支持最长 1M 标记的上下文窗口。提供两种推理强度:GLM-5.2 (max) 追求极限性能,GLM-5.2 (high) 平衡性能与 token 效率。API 定价与 GLM-5.1 保持一致。AI模型GLM-5.2Z.ai开源模型编码助手智能体推荐理由:Z.ai 新出的 GLM-5.2 模型,编码和智能体能力大幅增强,还有 1M 超大上下文,而且开源!API 价格没涨,值得试试。原文
03:03berryxia@berryxia73°NVIDIA开源了SOMA-X v0.2,一个使用单一骨架就能适配各种体型的3D人体模型。该模型具备关节扭转自动修正、骨骼自动缩放、高级姿态反转和超轻量数据特性,采用Apache 2.0许可证。它专为机器人和物理AI设计,可用于机器人训练、物理仿真和动作迁移,解决了不同机器人体型不统一导致动作数据难以复用的问题。AI模型SOMA-XNVIDIA3D人体模型机器人物理AI10 个信源在谈推荐理由:NVIDIA开源了SOMA-X v0.2,单一骨架就能适配不同体型,机器人动作数据复用门槛降低,训练效率提升。原文
03:01lmarena.ai@lmarena_ai精选72°GLM-5.2 (Max) 在 Agent Arena 排行榜上排名第10,得分接近 Claude-Opus-4.8(非推理模式)。它成为排名最高的开源模型,较去年发布的 GLM-5.1 从第13位上升3位。该模型在数百万真实长程任务上评测,可调用网页搜索、文件系统和终端工具。GLM-5.2 (Max) 输入/输出定价保持为每百万 token 1.4/4.4 美元,支持1M上下文窗口,权重采用 MIT 许可开源。AI模型GLM-5.2Zai_orgAgent Arena开源模型智能体推荐理由:Zai_org 发了 GLM-5.2,在 Agent 任务榜单上排第10,碾压所有开源模型,而且价格没变。跑复杂工作流、调工具效果明显进步。原文
02:29Google Research: Blog(资讯)Google Research 推出 Earth AI 机器学习模型,通过分析高分辨率卫星图像识别土地覆盖类型与植被健康度,支持生态恢复项目的规划与监测。该模型在 Global Land Cover 数据集上训练,覆盖 10 米分辨率地表信息,并已在巴西、澳大利亚等地测试。Google 还开源了相关模型与数据集,供研究社区使用。AI模型Earth AIGoogle开源模型卫星图像生态恢复推荐理由:Google 用 AI 看卫星图帮你规划种树恢复生态,模型和数据集都开源了,想做生态项目可以试试原文
02:17kimmonismus@kimmonismus77°GLM-5.2 以 MIT 许可证开源,权重开放。该模型支持 1M token 上下文窗口。提供 max 和 high 两种推理模式。专门针对大规模部署、自动化研究、性能优化和复杂调试进行训练。API 定价与 GLM-5.1 保持一致。AI模型GLM-5.2智谱开源模型长上下文推理模型推荐理由:智谱开源了 GLM-5.2,1M 上下文还能选推理模式,做长代码任务更强了。原文
01:59lmarena.ai@lmarena_aiAgent Arena 在其官方博客中介绍了用于智能体评估的因果追踪方法论。该方法可帮助研究人员分析智能体决策背后的因果链路。Agent Arena 平台本身支持多种智能体基准测试。AI模型Agent Arena智能体评估基准因果追踪推荐理由:Agent Arena 的因果追踪方法能帮你搞懂智能体为什么那么做,比单纯看分数更有用。原文
01:57Jim Fan@jimfan76°NVIDIA联合CMU和伯克利推出ENPIRE系统,让AI智能体完全自主控制真实机器人循环,包括重置环境、搜索文献、实现想法、训练部署、自我验证等步骤。该系统在整理别针、安装GPU、绑扎带等灵巧任务上达到99%成功率。机器人通过自提出启发式成功信号进行爬坡优化,无需人类介入。AI模型ENPIRENVIDIA机器人智能体自主循环8 个信源在谈推荐理由:NVIDIA搞了个ENPIRE,让AI自己操控机器人反复试错,真实任务成功率干到99%,连GPU都能自己插。原文
01:31lmarena.ai@lmarena_ai精选MiniMax M3 在全新 Agent Arena 排行榜上位列第18,是排名第5的开源模型。相比 M2.7,M3 从第22名升至第18名,主要改进是任务成功确认和 bash 错误恢复能力。工具幻觉保持低位,与最佳模型并列第一。排行榜基于30万+任务、200万+工具调用和4000万行代码的代理会话评估。AI模型MiniMaxM3Agent Arena开源模型智能体推荐理由:MiniMax M3 在 Agent Arena 上排名上升了4位,是最强开源模型之一,能写代码、做PPT、查资料,幻觉控制也顶级。原文
00:59AK@_akhaliqJoyAI发布了JoyAI-VL-Interaction模型,这是一个实时视觉语言交互智能系统。该模型支持实时视觉理解与语言生成,能够处理视频帧序列并生成自然语言响应。目前尚未公布具体基准测试成绩或版本号。AI模型JoyAI-VL-InteractionJoyAI多模态实时交互推荐理由:JoyAI出了个能实时看懂画面并跟你聊天的模型,适合做交互式AI应用。原文
00:55marktechpost@Asif Razzaq精选73°Qwen团队推出Qwen-RobotSuite,包含三个具身AI模型。RobotManip是基于Qwen3.5-4B的视觉-语言-动作模型,用于操作任务。RobotWorld是一个60层MMDiT架构的语言条件视频世界模型。RobotNav是基于Qwen3-VL的导航模型,提供2B、4B和8B三种参数量。AI模型Qwen-RobotSuiteRobotManipRobotWorldRobotNav具身AI推荐理由:一口气发了三个模型,从操作到导航都管了,全用自家Qwen3.5和Qwen3-VL,做机器人研究的可以看看。原文