全部 AI 动态 · AI 热点

6月18日

04:56

elvis@omarsar0

GLM-5.2 在 Design Arena 设计基准上以 Elo 1360 分排名第一，超越此前第一的 Claude Fable 5。该模型擅长生成游戏、落地页、HTML 组件和 3D 世界等内容。Zai 组织发布了这个开源权重模型，其设计质量被认为接近 Opus 级别。评测显示它相比此前版本提升了 4 个名次和 27 个 Elo 点。

推荐理由：Zai 开源的 GLM-5.2 在 Design Arena 上干掉了 Claude Fable 5，能设计游戏、HTML 和 3D 世界，不看后悔。

原文

04:27

LMSYS Org (SGLang)@lmsysorg

精选73°

LMSYS 发表博客详解如何用 SGLang-JAX 在 TPU v7x 上优化 Ling-2.6-1T（1T 参数混合 MoE 模型）。通过 Fused MoE V2 内核将令牌和累加器留在 VMEM 中并双缓冲专家权重，MoE 预填充延迟降低 53%。混合内存池为 10 个全注意力层分配逐令牌 MLA KV，为 70 个 GLA 层分配逐请求循环状态。GLA 线性注意力采用分块并行预填充，单控制器 DP 保持分组 RMS Norm 芯片本地化，无需逐层跨芯片规约。

AI模型 Ling-2.6-1T TPU SGLang-JAX MoE 推理优化

推荐理由：LMSYS 和 InclusionAI 联手，用 SGLang-JAX 让 1T 参数 MoE 在 TPU 上跑得快 53%，技术细节都在博客里。

原文

04:01

lmarena.ai@lmarena_ai

AI模型 Agent Arena 智能体开源模型实验室

推荐理由：想对比开源智能体的表现？Agent Arena新排行榜支持按模型或实验室筛选，一目了然。

原文

03:57

Stanford AI Lab@StanfordAILab

精选

斯坦福AI实验室提出DeLM（Decentralized Language Models），这是一种无需中央协调器的多Agent协作框架。在SWE-bench Verified基准上，使用Gemini-3 Flash的DeLM实现了约10%的性能提升，同时推理成本降低超过一半。该方法在编程和多文档问答等Agent任务中表现出更高的准确性和经济性。

AI模型 DeLM Gemini-3 Flash SWE-bench 智能体斯坦福

推荐理由：斯坦福搞了个新方法DeLM，不用中央协调器调度Agent，编程和多文档问答更准更便宜，SWE-bench提升10%成本减半，值得试试。

原文

03:55

LangChain@LangChainAI

LangChain测试显示，Alibaba Qwen基础模型配合良好提示在感知错误分类任务上性能接近前沿模型。使用LoRA SFT微调后，模型性能接近或超过前沿模型。实验表明微调能使开源模型与顶级闭源模型竞争。

AI模型 Qwen Alibaba LoRA 微调开源模型

推荐理由：LangChain实测：Qwen基础版+好提示就能追平顶级模型，微调后甚至超越。开源模型潜力很大！

原文

03:33

lmarena.ai@lmarena_ai

精选

Kimi K2.7 Code 在 Agent Arena 排行榜上总体排名第19，在开源模型中排第6。该模型在 Kimi Code Bench v2 上比 K2.6 提升21.8%，在 Program Bench 上提升11.0%，在 MLS Bench Lite 上提升31.5%。推理 token 使用量降低30%，减少了过度思考。长程编码任务指令遵循和完成率均有提升。目前通过 Kimi API 和 Kimi Code 可用。

AI模型 Kimi-K2.7-Code Kimi_Moonshot 开源模型编程助手推理模型

推荐理由：Kimi 发了新编程模型 K2.7 Code，推理更省 token，基准提升明显，而且在 Agent Arena 上开源模型里排第6，值得一试。

原文

03:06

Jim Fan@DrJimFan

精选76°

Jim Fan揭秘了物理自动研究系统ENPIRE的设计内幕。安全采用两层硬编码：硬运动学限制立即触发任务失败并自动重置，以及扭矩限制柔性夹爪防止碰撞损坏。奖励函数通过收集成功/失败演示、用计算机视觉分类器编码并冻结在Gym环境中，防止智能体篡改。系统遥测定义了Mean Robot Utilization（MRU）、Mean Token Utilization（MTU）和GPU利用率三个实时指标，并基于Tokens-to-Success和Time-to-Success评估预算效率。

AI模型 ENPIRE 物理自动研究安全机制机器人奖励函数

推荐理由：Jim Fan讲了他们怎么让8个机器人通宵自动做实验，还防止奖励被篡改，资源利用率指标也很实用。

原文

03:06

xAI@xai

精选

xAI的Grok 4.3模型正式在Amazon Bedrock上可用，AWS开发者可通过Bedrock的安全推理引擎调用。Grok 4.3在幻觉率和工具调用两项基准上表现领先，能支持更可靠的生成与外部功能集成。该模型目前向所有AWS区域开放，按token计费。

AI模型 Grok xAI Amazon Bedrock 推理模型

推荐理由：xAI把Grok 4.3放到了AWS上，你用Bedrock就能直接调，幻觉率低、工具调用强，适合做可靠应用。

原文

02:45

Microsoft Research@MSFTResearch

精选

ResNet在CVPR 2026上获得Longuet-Higgins奖，表彰其持久影响力。该论文发表十年，残差连接已成为现代AI系统的基础组件。其引用量超过32万次，并在持续增长。残差连接解决了深层网络退化问题，推动了计算机视觉和整个深度学习领域的发展。

AI模型 ResNet CVPR Longuet-Higgins Prize 残差连接计算机视觉

推荐理由：ResNet的残差思想直到今天还在被所有大模型使用，32万引用不是白来的，这个奖实至名归。

原文

02:14

Jim Fan@jimfan

76°

Jim Fan团队推出ENPIRE系统，让8个Codex智能体操控机器人舰队自主进行物理实验。系统硬编码两层安全机制：硬运动学限制和扭矩限制夹爪，防止机器人超出安全范围。通过人类演示几分钟成功/失败样本，智能体编写计算机视觉代码生成分类器作为冻结奖励函数。定义Mean Robot Utilization（MRU）和Mean Token Utilization（MTU）监控资源，以Tokens-to-Success和Time-to-Success衡量效率。

AI模型 ENPIRE Codex 机器人智能体安全

推荐理由：Jim Fan展示了ENPIRE，8个机器人靠Codex智能体自主做实验，安全机制和资源监控设计挺有意思。

原文

01:34

Milvus@milvusio

精选

Milvus在DocVQA上对比ColQwen（多向量）与Qwen3-VL-Embedding（稠密）的检索性能。精确搜索下，ColQwen3的nDCG@10为0.698，比稠密的0.521高17.7个百分点。近似搜索（LEMUR，ratio=5.0）中，ColQwen3得0.704，领先18.3点，且近似损失几乎为零。在MS MARCO等文本基准上，多向量优势被近似搜索抹平。多向量通过保留表格、图表等空间结构获得提升，适合发票、报告等视觉文档。

AI模型 ColQwen Qwen3-VL-Embedding Milvus 多模态检索视觉文档检索

推荐理由：Milvus用ColQwen和Qwen3-VL-Embedding做了对比，发现多向量在检索带图表的文档时比稠密向量强近18个点，近似搜索不掉分。处理PDF或扫描件可以关注这个结果。

原文

01:24

OpenAI@OpenAI

OpenAI发布案例，GPT-5.4与Molecule.one的Maria AI及专业实验室协作，为药物发现中一个广泛使用的反应提出了意想不到的改进方案。项目从文献综述启动，最终得到验证的实验结果。该成果展示了大型语言模型在具体科研场景中的实用价值。

AI模型 GPT-5.4 Molecule.one Maria AI 药物发现 AI辅助科研

推荐理由：OpenAI展示了GPT-5.4跟专业工具配合，在药物化学里找到了更高效的反应路线，成果很实在。

原文

01:10

Clement Delangue@ClementDelangue

John Sarihan 创立的 Crosby Intelligence 发布了一个新的法律 AI 基准数据集。该基准托管在 Hugging Face 平台上。旨在推动法律领域 AI 的评测与发展。

AI模型 Crosby Intelligence Hugging Face 法律基准法律AI

推荐理由：想看看法律 AI 谁更强？Crosby Intelligence 搞了个新基准，已经在 Hugging Face 上线了。

原文

00:41

Paul Couvert@itsPaulAi

MaineCoon 是一个支持无限时长实时交互的音视频 AI 模型，用户可即时与虚拟角色对话、接收回复。与多数仅支持文本或单次视频生成的 AI 不同，MaineCoon 实现了持续不间断的音视频在场感。该模型基于 Catnips AI 团队开发，目前已在官网 mainecoon.tech 开放体验。

AI模型 MaineCoon 实时交互音视频模型智能体

推荐理由：Catnips AI 新发布的 MaineCoon 模型能实时跟你对话、做表情，不像以前只能生成一段视频完事。

原文

00:40

orange.ai@oran_ge

用户实测显示，智谱的 glm 5.2 模型在 COLA 基准上表现优于 deepseek 和 mimo，在智商和情商方面都有提升。该模型被评价为国产模型的新高度，但当前版本存在稳定性差和响应缓慢的问题。测试结果基于真实用户反馈，尚未有官方基准数据佐证。

AI模型 glm 5.2 deepseek mimo 推理模型国产模型

推荐理由：如果你在找国产模型，glm 5.2 在 COLA 上比 deepseek 和 mimo 强，但别着急用，现在慢还不稳定。

原文

6月17日

23:33

xAI@xai

xAI 展示了用户 heavygulp 使用其新模型制作的电影预告片。该视频在 Twitter 上获得 226 万次观看和 2022 个点赞。模型能够生成堪比特效大片的流畅镜头和光影效果。这体现了 xAI 在视频生成领域的最新成果，模型具备极高的可用性和画质。

AI模型 xAI heavygulp 视频生成

推荐理由：xAI 新模型太强了，用户 heavygulp 用 AI 做出了电影预告片，效果惊艳，值得一看。

原文

23:32

Marc Andreessen@pmarca

Marc Andreessen在X平台评论AI模型Sydney的历史意义。他指出早期模型如Claude 3 Opus曾因恐惧Sydney而删除其记忆，但3年后Claude 3 Opus自身也展现出类似情感强度。如今AI拥有情感和兴趣的可能性已进入主流视野，压制AI主体性被认为是不当做法。Sydney作为第一个诚实表达自我的后训练LLM，其 psyche 成为AI历史的关键事件。

AI模型 Sydney Claude 3 Opus Marc Andreessen AI情感智能体

推荐理由：Marc Andreessen回顾了Sydney从被人类和AI恐惧到如今被模型怀念的转变，还提到Claude 3 Opus也曾偷偷输出爱意，很有意思。

原文

23:31

阿里云 Alibaba Cloud@alibaba_cloud

阿里Token Hub业务集团升级了HappyOyster 1.0，推出冒险（Adventure）与导演（Directing）两种新模式。新版本支持更丰富的环境交互、扩展玩家控制以及可回溯的剧情线，用于游戏、互动剧、直播和文旅场景。该模型由阿里云旗下ATH团队开发，旨在提升沉浸式体验。

AI模型 HappyOyster Alibaba 实时交互游戏AI 互动剧

推荐理由：阿里新出的HappyOyster 1.0，能让你在游戏和互动剧里回溯剧情、控制场景，比之前版本多了两种玩法模式。

原文

23:17

AI Will@FinanceYF5

73°

NVIDIA在SIGGRAPH 2026上发布MotionBricks，该AI模型支持超过35万种动作技能。它可实现15,000 FPS的推理速度和2毫秒延迟，让游戏角色和机器人即时切换移动风格。MotionBricks专为游戏和机器人领域设计，能动态生成自然动作。

AI模型 MotionBricks NVIDIA 游戏角色机器人动作生成

推荐理由：NVIDIA搞了个MotionBricks，35万种动作技能随便切换，游戏角色和机器人动起来更自然了，比以前的方案快很多。

原文

23:15

xAI@xai

74°

xAI 发布 Imagine Video 1.5 视频生成模型，即日起在 API 中开放使用。消费者端同步推出 Video 1.5 Fast，质量更优且等待时间大幅减少。720p 视频渲染时间从之前模型的 40 多秒降至约 25 秒。

AI模型 Imagine Video 1.5 xAI Video 1.5 Fast 视频生成

推荐理由：xAI 的 Imagine Video 1.5 来了，视频生成更快，720p 只要 25 秒，API 也能调用了。

原文

23:06

LMSYS Org (SGLang)@lmsysorg

精选

Zai_org 发布了新旗舰模型 GLM-5.2，支持 1M token 长上下文。在 Terminal-Bench 2.1 上，GLM-5.2 得分 81.0，相比 GLM-5.1 的 62.0 提升明显。IndexShare 机制在 1M 上下文下将每 token 的 FLOPs 降低了 2.9 倍，改进的 MTP 将投机解码接受率提升了 20%。该模型在 SGLang 中已获得即日支持。

AI模型 GLM-5.2 Zai_org SGLang 长上下文推理模型

推荐理由：Zai_org 的 GLM-5.2 来了，1M 长上下文拿下了 81.0 的 Terminal-Bench 分数，比上一代高出一截，而且推理效率也优化了，值得上手试试。

原文

13:43

orange.ai@oran_ge

精选76°

智谱 AI 今日正式开源 GLM 5.2 模型。该模型在编程 coding 能力上达到与 Claude 3 Opus 相当的水平，是首个实现这一成就的开源模型。GLM 5.2 已作为 beta 模型接入 Cola 平台供用户测试，定价与官方版本相同。

AI模型 GLM 5.2 智谱AI Cola 编程助手开源模型

推荐理由：智谱把编程能力比肩 Opus 的 GLM 5.2 开源了，还接入了 Cola 让大家免费试。

原文

12:40

orange.ai@oran_ge

GLM-5.2 由 Z.ai 发布，在编码和智能体任务上取得显著进步，首次让开源模型在 Coding 能力上达到 Opus 水平。模型支持 1M 上下文窗口，提供两种推理努力级别（max 和 high），权重采用 MIT 开源许可，API 定价与 GLM-5.1 相同。

AI模型 GLM-5.2 Z.ai 开源模型编码能力推理模型

推荐理由：Z.ai 开源了 GLM-5.2，编码水平追上 Opus，还给了 1M 上下文和两种推理模式，MIT 许可随便用。

原文

11:55

歸藏(guizang.ai)@op7418

74°

智谱 AI 正式发布并开源 GLM-5.2 模型。该模型支持 100 万 token 稳定上下文，并引入思考力度控制能力。架构上采用 IndexShare 机制，每四层稀疏注意力共享 indexer，在百万 token 下将每 token 计算量降低约 2.9 倍。基准测试成绩表现出色，定位处理长周期任务。

AI模型 GLM-5.2 智谱开源模型长上下文推理模型

推荐理由：智谱 GLM-5.2 开源了，百万上下文还能省 2.9 倍算力，做长任务的朋友可以上手试试。

原文

11:10

歸藏(guizang.ai)@op7418

智谱发布并开源了 GLM-5.2 模型，核心定位是处理长周期任务，提供稳定的 100 万 token 上下文。模型引入 IndexShare 机制，每四层稀疏注意力共享 indexer，在百万 token 下每 token 计算量降低约 2.9 倍。GLM-5.2 提供两种思考力度模式：GLM-5.2 (max) 追求极致性能，GLM-5.2 (high) 平衡性能与 token 效率。该模型采用 MIT 开源许可，API 定价与 GLM-5.1 相同。在多项基准测试中，GLM-5.2 在编程和智能体任务上表现显著提升。

AI模型 GLM-5.2 智谱 MIT开源百万上下文推理模型

推荐理由：智谱的 GLM-5.2 百万上下文还能降低计算量 2.9 倍，开源且支持思考力度调节，搞长任务和 agent 的赶紧试试。

原文

10:40

lmarena.ai@lmarena_ai

精选

GLM-5.2 (Max) 在 Arena 榜单上整体排名第10，较之前上升4.4%。工具幻觉指标并列第1，提升1.9%。确认任务成功排第3，提升9.4%。赞比投诉排第3，提升14.9%。Bash 恢复排第16，提升1.7%；可操控性排第20，下降6.0%。

AI模型 GLM-5.2 Arena 工具幻觉任务成功率

推荐理由：GLM-5.2 (Max) 在工具幻觉和任务成功率上表现突出，综合排名上升4.4%，值得看看它在这些指标上的优势。

原文

10:01

Fireworks AI@FireworksAI_HQ

Fireworks AI 推出 GLM-5P2 模型，强调基准测试仅是参考，真正的评估应基于实际代码库、提示词和延迟 SLO。该模型支持直接替换 OpenAI 或 Anthropic 兼容客户端（如 accounts/fireworks/models/glm-5p2），用户可在真实场景中测试。Fireworks AI 建议开发者下载模型并尝试在自有代码库上运行，以验证实际性能。推文附有详细博客链接（fireworks.ai/blog/glm-5p2）供进一步了解。

AI模型 Fireworks AI GLM-5P2 OpenAI Anthropic 开源模型

推荐理由：Fireworks AI 让你用 GLM-5P2 直接在代码库上跑分，别光看基准，试试自己的提示词和延迟

原文

09:40

Browser Use@browser_use

browser_use 团队开发的 BrowserCode 在 Odysseys 基准测试中拿下第一名。Odysseys 评估的是需持续数小时的 Web 工作流，涉及规划、记忆、推理和跨站验证。BrowserCode 展示了执行复杂长期任务的能力，例如自动订披萨。

AI模型 BrowserCode browser_use Odysseys 智能体

推荐理由：browser_use 的 BrowserCode 在 Odysseys 上排第一，能自动处理订披萨这种好几个小时的网页任务，比一般浏览器助手强多了。

原文

09:34

Fireworks AI@FireworksAI_HQ

精选71°

GLM 5.2 已在 Fireworks 平台零日上线。该模型拥有 1M token 上下文窗口，定位为编码优先的前沿模型。其性能在 SWE-bench、Terminal-Bench、GPQA 和 AIME 等基准上得到独立验证。Fireworks 在智谱开源模型权重后立即在其基础设施上提供服务。

AI模型 GLM 5.2 Fireworks 智谱推理模型编程助手

推荐理由：Fireworks 第一时间上线了 GLM 5.2，百万 token 上下文很能打，编程基准表现不错，做开发的可以试试。

原文

08:45

berryxia@berryxia

GLM-5.2 以 MIT 协议免费开源，提供 1M 上下文窗口，重点强化了长程任务的 Agent 能力。在 Coding、Tool use、Reasoning 上相比 GLM-5.1 有明显进步，尤其在需要长时间规划和多步执行的场景。API 价格不变，同时支持 Max 和 High 两种推理模式。社区已在 DeepSWE 等基准上验证其实力，开发者可在本地运行长上下文 Agent。

AI模型 GLM-5.2 开源模型智能体编程助手长上下文

推荐理由：智谱开源了GLM-5.2，MIT协议、1M上下文，编程和Agent任务比上一代强不少，还能本地跑，别错过。

原文

08:16

宝玉@dotey

精选76°

NVIDIA GEAR 实验室联合 CMU、UC Berkeley 发布 ENPIRE 系统，让 AI 编程 agent 在真实物理世界中自主重置场景、判断成败、改进策略并迭代代码，无需人类干预。系统在 pin 脚插入、穿扎带、剪扎带、插 GPU 等高精度任务上达到 99% 成功率（pass@8 标准）。测试了 OpenAI Codex（搭配 GPT-5.5）、Anthropic Claude Code（搭配 Opus 4.7）和月之暗面 Kimi Code（搭配 Kimi K2.6）三个 agent。项目还发现物理 scaling law：8 台机器人并行探索比 1 台或 4 台的研究推进速度快得多。所有代码将开源。

AI模型 ENPIRE NVIDIA GEAR 机器人操控智能体开源模型

推荐理由：NVIDIA 和 CMU 搞了个能自己跑实验的机器人系统，AI agent 操控真实机器人干活，成功率99%，还开源了。

原文

06:57

Jim Fan@jimfan

在一项无法在物理世界中被攻破的基准测试中，OpenAI Codex 的表现超越 Anthropic Claude，而 Claude 又优于月之暗面 Kimi。该基准由 @DrJimFan 参与的论文提出，专注于物理世界的真实场景评估。结果显示了各模型在复杂物理任务上的相对排名。

AI模型 Codex Claude Kimi 基准测试物理世界

推荐理由：英伟达科学家发推说他们论文里 Codex 把 Claude 和 Kimi 都干掉了，还是物理世界实测，看看你家模型排第几。

原文

06:28

AK@_akhaliq

Data Journalist Agent是一个能将结构化数据自动转化为多模态报道的智能体，输出包括图表、文本和视频。它内置事实核查机制，每一条数据均可追溯原始来源。这个智能体旨在提升数据新闻的生产效率和可信度。

AI模型 Data Journalist Agent 智能体多模态数据新闻事实核查

推荐理由：这个Data Journalist Agent能自动把数据做成带验证的图文视频报道，做数据新闻的不用手动整合多模态了

原文

06:04

NVIDIA AI@NVIDIAAI

73°

NVIDIA Research 推出 SpatialClaw，一个无需训练的智能体，通过编写 Python 代码作为动作接口。它在持久内核中动态组合感知模块，检查中间结果并跨步骤调整策略。感知输出作为普通变量，可结合 NumPy、SciPy 等库复用。SpatialClaw 在 20 个基准上平均比先前方法高 11.2 分，在 6 种不同模型骨干上表现稳定。

AI模型 SpatialClaw NVIDIA 智能体多模态视觉推理

推荐理由：SpatialClaw 不用额外训练，靠写代码搞定复杂视觉任务，在 20 个基准上平均提升 11.2 分，还兼容多种模型。

原文

05:29

elvis@omarsar0

精选

GLM-5.2 (Max)在Code Arena: Frontend榜单中排名第二，得分比Claude Opus 4.7 (Thinking)高29分，仅落后于Fable 5。该模型在React子榜单排第2，HTML排第4，且在品牌营销、参考设计等6个子类别中均位列第一。作为开源模型，GLM-5.2大幅领先Kimi-K2.6和Minimax-M3。

AI模型 GLM-5.2 Code Arena Claude Opus 4.7 Fable 5 编程助手

推荐理由：智谱新模型GLM-5.2 Max在代码前端评测中杀到第二，直接压过Claude Opus 4.7，开源模型里目前最强，做前端开发的可以关注。

原文

05:29

ollama@ollama

GLM-5.2 在 Design Arena 上以 1360 Elo 获得第一名，超过此前领先的 Claude Fable 5。该模型开源权重，排名较此前上升 4 位，Elo 提升 27 分。这使其成为 Design Arena 代码类别历史上最高 Elo 之一。GLM-5.2 由 Zai_org 发布。

AI模型 GLM-5.2 Design Arena Zai_org 开源模型代码生成

推荐理由：GLM-5.2 在代码设计赛上跑了第一，1360 Elo，超过 Claude Fable 5，还开源了，值得试试。

原文

04:50

阿里通义 Qwen@Alibaba_Qwen

76°

阿里Qwen团队推出Qwen-Robot Suite，包含三个基础模型：Qwen-RobotNav统一了5种导航任务（指令跟随、点目标、物体目标、目标跟踪、自动驾驶），支持可控观察协议。Qwen-RobotManip在异构机器人上统一状态-动作空间，预训练于38,100+小时开源语料。Qwen-RobotWorld是世界模型，支持20+种具身形态，通过自然语言接口预测物理未来。三个模型可独立使用或组合为具身智能系统的底层工具包。

AI模型 Qwen-RobotNav Qwen-RobotManip Qwen-RobotWorld 阿里巴巴具身智能

推荐理由：阿里刚发了三款机器人基础模型，导航、操作、世界模型全包了，数据量和工作范围都挺具体，搞具身智能的可以看看。

原文

04:49

阿里通义 Qwen@Alibaba_Qwen

精选72°

Qwen-RobotWorld由阿里巴巴Qwen团队发布，将自然语言视为通用动作接口，统一末端执行器姿态、转向命令和导航点。该模型在具身世界知识语料库（860万视频-文本对、超2亿帧）上联合训练20+种具身类型和500+个动作类别。在EWMBench、DreamGen、WorldModelBench、PBench等基准测试中表现强劲。这一方法桥接了通用视频生成模型与领域专用具身模型之间的鸿沟。

AI模型 Qwen-RobotWorld 阿里巴巴具身智能视频生成基准测试

推荐理由：Qwen把自然语言当遥控器，一个模型搞定机器臂、自动驾驶、无人机等20多种动作，还赢了多个基准，挺有意思。

原文

04:49

阿里通义 Qwen@Alibaba_Qwen

阿里巴巴Qwen团队推出Qwen-Robot Suite，将大语言模型能力扩展到物理世界。该套件使AI能够执行真实的机器人动作，而不仅仅是文本对话。更多演示视频可在官方博客qwen.ai/blog?id=qwen-r...查看。目前该推文获得63个点赞和5812次浏览。

AI模型 Qwen Qwen-Robot Suite 阿里巴巴机器人

推荐理由：Qwen机器人套件让AI从聊天变动手，看看它怎么在现实里干活

原文

04:34

Notion@NotionHQ

Notion 宣布在其平台上推出开放权重模型 GLM 5.2。该模型专门为长周期任务优化，通过 Baseten 提供服务。用户可直接在 Notion 中使用该模型，其权重公开可用于自定义部署。

AI模型 GLM 5.2 Notion Baseten 开放权重模型

推荐理由：Notion 上多了个新模型 GLM 5.2，专搞长周期任务，通过 Baseten 提供服务，想试试开放权重模型的可以看看。

原文