全部 AI 动态 · AI 热点

6月3日

20:03

Geek@geekbb

Datawhale 推出了一套开源的世界模型课程，包含五讲和五个配套项目，覆盖从 VAE 到 Dreamer 再到评估仪表盘的完整学习路径。课程强调动手实践，帮助学习者系统理解世界模型的原理、架构和实现。对于想深入世界模型领域的研究者、学生或开发者来说，这是一份难得的免费学习资源。

AI模型世界模型开源/仓库课程 VAE Dreamer

推荐理由：想系统入门世界模型的开发者终于有了一条清晰的动手路径——五讲五项目从 VAE 到 Dreamer 全覆盖，比啃论文高效得多，建议直接跟着项目跑一遍。

原文

13:48

Mustafa Suleyman@mustafasuleyman

88°

微软CEO Mustafa Suleyman宣布推出7款全新MAI系列模型，包括文本基础模型MAI-Thinking-1、图像模型MAI-Image-2.5及高效编程模型MAI-Code-1-Flash。MAI-Thinking-1拥有350亿激活参数的MoE架构，256K上下文窗口，在AIME 2025上达到97%，SWE Bench Pro上53%，与Opus 4.6持平，且盲测中整体质量优于Sonnet 4.6。该模型针对微软自研MAIA 200芯片优化，性能每美元提升30%，每瓦性能提升1.4倍。MAI-Code-1-Flash仅5B参数，SWE Bench Pro达51%，成本更低。微软还推出Frontier Tuning服务，允许企业定制专属模型，早期案例中为McKinsey定制模型以10倍低成本超越GPT-5.5。

AI模型 MAI-Thinking-1 MAI-Code-1-Flash MAI-Image-2.5 推理模型编程助手

推荐理由：微软一口气推出7款新模型，覆盖推理、编程、图像三大方向，MAI-Thinking-1在推理和编码上直接对标Claude Sonnet 4.6和Opus 4.6，做AI应用或企业定制化模型的团队值得关注——尤其是Frontier Tuning让企业用更低成本获得超越GPT-5.5的效果。

原文

09:52

berryxia@berryxia

微软发布的新模型 MAI-Image-2.5 在图像编辑能力评测中取得第二名，仅次于 OpenAI 的 GPT-Image-2。该模型超越了 Google 的 Nano Banana 模型，显示出微软在图像生成与编辑领域的快速进步。评测结果引发了对 Google 在 AI 图像领域创新速度的讨论，部分用户表示期待 Google 推出更强的新模型。

AI模型图像编辑微软 MAI-Image-2.5 GPT-Image-2 模型评测

推荐理由：图像编辑模型竞争白热化，微软 MAI-Image-2.5 已超越 Google，做 AI 图像生成或编辑的开发者可以关注这个新选择，看看它和 GPT-Image-2 的差距在哪。

原文

09:52

berryxia@berryxia

精选

微软AI今日发布了七个全新MAI模型，包括MAI-Thinking-1、MAI-Code-1-Flash、MAI-Image-2.5等，覆盖推理、编码、图像、语音和转录任务。这些模型是从零开始、使用干净数据训练，不依赖蒸馏，强调血统纯净。其中MAI-Code-1-Flash在SWE-Bench Verified上达到71.6分，超越Claude Haiku 4.5，且节省60% token。MAI-Image-2.5在图像编辑和文本生图排名靠前，已集成到PowerPoint和OneDrive。微软的策略是构建专精任务、可协作的模型家族，而非追求单一通用大模型。

AI模型微软 MAI模型编程助手推理模型图像生成

推荐理由：微软这次反主流而行，用干净数据从零训练专精模型，做AI开发或选型的人值得关注——MAI-Code-1-Flash在编码任务上性价比突出，Copilot用户可以直接体验。

原文

08:22

lmarena.ai@lmarena_ai

AI模型微软 MAI-Image-2.5 图像生成 AI模型内容创作

推荐理由：微软在图像生成赛道的新动作值得关注，做内容创作或 AI 应用开发的团队可以看看这个模型能否提升你的工作流效率。

原文

08:17

Clement Delangue@ClementDelangue

Hugging Face CEO Clement Delangue 在 X 上发文，呼吁社区更多关注 Arcee 这家美国开源 AI 模型公司。他指出，美国优秀的开源 AI 模型公司并不多，而 Arcee 是其中之一。Arcee 在 Hugging Face 上发布了多个开源模型，其模型在特定任务上表现优异，且完全开源可商用。这一呼吁引发了社区对 Arcee 及其模型的重新关注，也反映了开源 AI 生态中美国公司的稀缺性。

AI模型开源/仓库 Arcee Hugging Face AI模型美国

推荐理由：美国开源 AI 模型公司稀缺，Arcee 是少数值得关注的玩家。做开源模型研究或寻找可商用模型的开发者，建议去 Hugging Face 看看他们的模型仓库。

原文

08:12

lmarena.ai@lmarena_ai

精选76°

微软在Build大会上发布了七款全新的MAI系列模型，涵盖推理、代码、图像、转录和语音等能力。这些模型从零开始训练，基于干净的数据溯源，设计注重效率，并作为模型家族无缝协作。其中MAI-Image-2.5是图像生成模型，其他模型包括推理、代码生成、语音识别等。这标志着微软在自研AI模型上的重大投入，旨在为开发者提供一体化AI解决方案。

AI模型微软 MAI模型 Build大会图像生成推理模型

推荐理由：微软一口气推出七款自研模型，覆盖推理到语音全场景，做AI应用开发的团队可以直接集成，省去拼凑多家模型的麻烦。

原文

08:12

OpenRouter@OpenRouterAI

微软发布 MAI-Image-2.5 模型，在文本到图像和图像到图像排行榜上分别位列第3和第2，性价比领先市场。该模型支持精准的图像生成与编辑，目前已在 OpenRouter 平台上线。对于需要高质量图像生成且预算有限的团队，这是一个值得关注的选择。

AI模型微软 MAI-Image-2.5 图像生成图像编辑 OpenRouter

推荐理由：微软 MAI-Image-2.5 以市场领先的性价比登顶排行榜，做图像生成或编辑的团队可以直接在 OpenRouter 上试用，省下不少成本。

原文

05:02

rohanpaul_ai@rohanpaul_ai

88°

微软发布了 MAI-Thinking-1，这是其自研推理模型系列的首个成果。该模型采用 1T 总参数的混合专家架构，每次推理仅激活 35B 参数，在 AIME 2025 上达到 97.0%，LiveCodeBench v6 上 87.7%，SWE-Bench Pro 上 52.8%。微软称其训练流程为“爬山机器”，通过持续优化数据、训练、奖励和安全测试形成闭环。预训练基于 30T 主要人工生成 token，避免使用第三方模型蒸馏，随后通过强化学习提升数学、编程、工具使用和安全能力。这标志着微软在推理模型领域建立了完整的自研能力。

AI模型推理模型微软 MAI-Thinking-1 混合专家模型强化学习

推荐理由：微软用自研数据+强化学习打造了强推理模型，做 AI 推理或模型训练的团队值得关注其“爬山机器”方法论，尤其是 35B 激活参数就能达到接近顶尖水平的效率。

原文

04:50

lmarena.ai@lmarena_ai

微软发布的MAI-Image-2.5模型在Image Edit Arena（单图编辑）中排名第二，得分1401，并推进了帕累托前沿，意味着在其价格区间内没有模型得分更高。该模型比Nano Banana 2、Grok Imagine Image Quality和ChatGPT-Image-Latest-High Fidelity高出10分以上。这一成就展示了微软在图像编辑AI领域的竞争力，为开发者提供了高性价比的优质选择。

AI模型微软 MAI-Image-2.5 图像编辑竞技场排名帕累托前沿

推荐理由：图像编辑开发者或团队如果追求性价比，MAI-Image-2.5在同等价位下性能领先，值得关注并尝试集成。

原文

04:50

lmarena.ai@lmarena_ai

微软AI团队正式发布MAI-Image-2.5图像编辑模型，在单图编辑竞技场中排名第二，得分1401，领先Nano Banana 2、Grok Imagine Image Quality和ChatGPT-Image-Latest-High Fidelity等模型10分以上。该模型推进了帕累托前沿，意味着在质量和效率之间取得了更好的平衡。对于从事图像编辑、AI绘画或需要高质量图像生成的开发者与创作者来说，这是一个值得关注的新选择。

AI模型微软 MAI-Image-2.5 图像编辑模型发布竞技场

推荐理由：微软MAI-Image-2.5在图像编辑质量上超越了多个主流模型，做AI图像生成或编辑的团队可以关注这个新基准，直接对比现有方案。

原文

04:44

OpenRouter@OpenRouterAI

微软发布MAI-Voice-2，一款支持15种语言的情感可控文本转语音模型，可表达兴奋、尴尬、耳语等情绪，并在长文本中保持稳定的说话人身份。该模型与MAI-Transcribe-1.5语音识别模型搭配使用，已在OpenRouter上线。这为多语言内容创作、有声读物、语音助手等场景提供了更自然、富有表现力的语音合成能力。

AI模型微软 MAI-Voice-2 文本转语音情感控制多语言

推荐理由：做多语言内容或语音应用的团队终于有了一个能控制情绪、长文本不跑调的TTS模型，直接上OpenRouter就能用，值得试试。

原文

04:40

Together AI@togethercompute

76°

MiniMax-M3 是一款结合了 1M 上下文窗口、原生多模态能力和 MiniMax 稀疏注意力机制的新模型。Together 的推理和内核团队通过 KV-block-major 稀疏注意力、分页 MSA 解码、优化索引评分以及 GPU 工作前的多模态预处理，将常见智能体流量下的吞吐量提升了 81-125%。该模型在长上下文和多模态任务上表现出色，适合需要处理大量信息和多种数据类型的应用场景。

AI模型 MiniMax-M3 稀疏注意力多模态长上下文推理优化

推荐理由：做长上下文和多模态应用的团队可以关注——MiniMax-M3 的稀疏注意力优化让吞吐量提升显著，直接降低推理成本，值得一试。

原文

03:38

Paul Couvert@itsPaulAi

微软发布了一款新的图像编辑模型，在单图编辑任务上排名第二，仅次于GPT-Image-2，同时在文生图和文字渲染任务上分别排名第三。该模型经过数天测试，表现令人惊讶，但目前仅支持单图上传编辑，不支持多图编辑。这一发布表明微软在图像生成与编辑领域正快速追赶领先者。

AI模型图像编辑微软文生图模型排名 Nano Banana 2

推荐理由：图像编辑开发者或AI绘画爱好者可以关注这款新模型，它提供了接近GPT-Image-2的编辑质量，且目前免费可用，值得一试。

原文

02:53

NVIDIA AI@NVIDIAAI

78°

NVIDIA 宣布推出 Cosmos 3，号称首个面向物理 AI 的全模态模型。该模型能够处理多种输入模态（如文本、图像、视频等），并应用于机器人、自动驾驶等物理世界场景。官方展示了多个令人惊叹的示例，体现了模型在理解与生成物理交互方面的能力。这标志着 AI 从数字世界向物理世界迈出了重要一步。

AI模型物理AI 全模态模型 NVIDIA 机器人自动驾驶

推荐理由：做机器人或自动驾驶的开发者终于有了一个能统一处理多模态输入的物理 AI 模型，值得看看它能带来哪些新可能。

原文

02:32

Harrison Chase@hwchase17

验证器对于扩展评估和强化学习至关重要，但成本高昂。Harvey 团队与 LangChain 合作，探索如何降低验证器成本。该研究由 Vtrivedy10、jakebroekhuizen 等人主导，旨在解决验证器在规模化应用中的经济瓶颈。这项工作可能为 AI 评估和 RL 训练提供更经济的方案。

AI模型验证器评估强化学习成本优化 LangChain

推荐理由：做 AI 评估或强化学习的团队，验证器成本一直是个头疼问题——Harvey 和 LangChain 的这项研究直接给出了降本思路，值得关注。

原文

01:08

Google DeepMind@GoogleDeepMind

精选

Google DeepMind 系统与全球科学专家合作，一年内处理了多个复杂科学问题。系统成功识别出肝纤维化的新治疗靶点。它还发现了针对肌萎缩侧索硬化症的新研究方法。系统通过消化数十年文献，提出了逆转衰老的新遗传线索。

AI模型 Google DeepMind 科学发现肝纤维化 ALS 衰老

推荐理由：系统搞定三个难题

原文

6月2日

22:55

阶跃星辰 Stepfun@Stepfun_AI

Step 3.7 Flash 是一款面向快速智能体编码的开源权重模型，支持可靠工具调用和多模态理解。该模型已从模型卡片阶段进入实际编码工作流，由 @kilocode 团队在博客中详细介绍。其设计重点在于提升智能体编码效率，适合开发者集成到自动化编程任务中。这一进展标志着开源模型在实用化方面迈出重要一步。

AI模型开源/仓库推理模型编程助手智能体 MCP/工具

推荐理由：做智能体编码的开发者终于有了一个可直接使用的开源模型——Step 3.7 Flash 的可靠工具调用和多模态能力能显著提升自动化效率，建议点开博客了解具体集成方式。

原文

14:12

AI Will@FinanceYF5

精选

据社交媒体消息，Nemotron 3 Ultra 计划于本周发布。目前尚无具体参数或性能数据。详细信息需等待官方进一步披露。

AI模型 Nemotron 3 Ultra Nvidia 模型发布

推荐理由：Nvidia 的 Nemotron 3 Ultra 马上要来了

原文

12:55

阶跃星辰 Stepfun@Stepfun_AI

精选

StepFun 的 Step 3.7 Flash 模型通过 MFA 和 AFD 技术，从设计之初就注重效率，而非事后优化。这些技术显著降低了 KV-cache 成本，使模型运行更经济高效。Fireworks AI 提供了便捷的一键部署支持，开发者可以快速上手。该模型特别适合构建智能体应用，体现了“效率优先”的设计哲学。

AI模型 Step 3.7 Flash KV-cache 效率优化智能体 Fireworks AI

推荐理由：Step 3.7 Flash 通过原生效率设计解决了 KV-cache 成本痛点，做智能体应用的开发者可以直接用 Fireworks AI 一键部署，值得试试。

原文

12:10

Latent.Space@latentspacepod

精选

Ethan He 在 Latent Space 播客中分享了对视频生成、世界模型、LLM、智能体和持续学习的看法。他认为视频模型的大部分智能来自语言而非视频数据，idea-to-code 的速度已经很快，瓶颈在于计算资源。他强调迭代速度在模型开发中几乎压倒一切，下一个飞跃将是视频智能体而非更好的视频模型。他还预测扩散模型将成为 AGI 的前端，LLM 作为后端，生成式 UI 将取代 HTML/CSS，物理具身可能成为强大 AI 的工具。

AI模型视频生成世界模型智能体扩散模型 LLM

推荐理由：Ethan He 对 AI 前沿的预判直击要害，做视频生成、智能体或世界模型的开发者看完会有启发——尤其是关于迭代速度和智能体方向的洞察，值得点开细品。

原文

10:36

Skywork@Skywork_ai

精选

Skywork 宣布其模型 Opus 4.8 升级，主要提升了两项能力：长文档分析速度更快，能从密集文件中快速提取关键信息而不拖慢工作流；跨域多步推理能力增强，能更精准地规划、决策和执行复杂任务。这标志着 Skywork 在文档处理与复杂推理场景的实用化迈出一步，适合需要处理大量文档或进行多步骤推理的用户。

AI模型 Opus 4.8 Skywork 长文档分析多步推理模型升级

推荐理由：做文档密集型工作或复杂推理的团队，可以关注 Opus 4.8 带来的速度与精准度提升，值得一试。

原文

10:36

Skywork@Skywork_ai

88°

AI模型 Claude Opus 4.8 推理模型 Skywork Anthropic 模型更新

推荐理由：Claude Opus 4.8 的更强推理能力对需要高精度判断的开发者（如代码审查、逻辑分析）是直接利好，Skywork 用户现在就能体验，建议试试。

原文

10:35

Harrison Chase@hwchase17

精选76°

MiniMax 正式发布 M3 模型，这是首个同时具备编码、智能体能力和原生多模态的开放权重模型。在 SWE-Bench Pro 上达到 59.0%，Terminal Bench 2.1 为 66.0%，并支持 1M 上下文窗口。模型权重和技术报告将在约 10 天后公开。开发者可通过 API 和专属代码平台 code.minimax.io 使用。

AI模型 MiniMax M3 开源模型编码能力智能体

推荐理由：MiniMax M3 把编码、智能体和多模态三合一开源，做 AI 应用和 Agent 开发的团队可以直接拿来用，尤其适合需要长上下文和复杂任务自动化的场景。

原文

10:30

shao__meng@shao__meng

Claude Opus 4.8 在基准测试、诚实度和长任务处理上优于 4.7，但作者认为这种进步对用户来说并不构成真正的改变，只是 4.7 的升级版。对于已经在用 Opus 4.7 的用户，切换到 4.8 是自然的选择，但不会吸引 GPT-5.5 或 DeepSeek 的用户迁移。作者指出，除非 Opus 5 有重大突破，否则难以撼动现有格局。

AI模型 Claude Opus 4.8 模型对比升级 Benchmark 用户迁移

推荐理由：如果你在用 Opus 4.7，升级到 4.8 是顺理成章的事；但如果你是 GPT 或 DeepSeek 用户，这次更新不值得你切换。做模型选型的团队可以看看这篇冷静分析，避免被 Benchmark 数字带偏。

原文

10:20

elvis@omarsar0

精选

受 Karpathy 关于 LLM 知识库的帖子启发，作者认为微调模型以优化智能体技能、记忆、上下文工程、路由效率和知识库将变得非常重要。这一方向可能改变 AI 系统的实用性和效率，尤其对构建复杂智能体的开发者有深远影响。作者还分享了一篇相关阅读链接，供进一步探讨。

AI模型微调智能体知识库上下文工程路由效率

推荐理由：Karpathy 的洞察点出了微调在智能体系统中的关键作用，做 AI 智能体开发的团队值得关注这一趋势，建议点开原文看看具体思路。

原文

10:04

Browser Use@browser_use

Minimax M3 模型在 BU Bench 基准测试中取得了显著进步，相比之前版本提升了 26%。该测试使用 browsercode 方法评估模型在浏览器自动化任务上的表现。目前 M3 的性能已与 Claude 4.6-sonnet 和 Gemini 3.5 flash 等主流模型持平。这一结果表明 Minimax 在浏览器智能体领域取得了重要突破，为未来进一步优化奠定了基础。

AI模型 Minimax M3 BU Bench 浏览器自动化智能体模型评测

推荐理由：做浏览器自动化或智能体开发的团队值得关注——Minimax M3 用 26% 的提升证明自己已跻身第一梯队，可以直接拿来对比测试。

原文

09:51

Julien Chaumond@julien_c

精选

阿里巴巴 Qwen 团队发布 Qwen3.7-Plus，一个多模态智能体模型，统一了视觉和语言能力。该模型支持多模态交互式混合智能体，可同时处理 GUI 和 CLI 操作，具备视觉感知、推理、定位和搜索增强问答能力。它还能作为全能编码助手和生产力工具，接受全模态输入。Qwen3.7-Plus 现已通过阿里云模型服务 API 提供，开发者可直接尝试。

AI模型 Qwen 多模态智能体开源/仓库阿里云

推荐理由：多模态智能体模型将视觉与语言统一，做自动化操作和智能体开发的团队可以直接用 API 试，省去自己拼接多模型的工作。

原文

09:32

阿里通义 Qwen@Alibaba_Qwen

83°

阿里 Qwen 团队正式推出 Qwen3.7-Plus，这是一款将视觉与语言能力统一的多模态智能体模型。它支持多模态交互混合智能体，可同时处理 GUI 和 CLI 操作；具备全模态输入的编程助手与生产力工具能力；视觉方面涵盖感知、推理、定位和搜索增强问答。该模型在多种智能体框架上表现出跨框架泛化能力，现已通过阿里云 Model Studio API 开放使用。

AI模型多模态智能体 Qwen3.7-Plus 阿里云 API

推荐理由：做多模态应用或智能体开发的团队可以直接用 API 试——一个模型搞定看、想、写、做，省去多模型拼接的麻烦。

原文

08:23

Guillermo Rauch@rauchg

76°

MiniMax M3 在 Next.js 智能体评测中成为领先的开源模型，性能仅次于 Opus 和 GPT-5，但成本低 10 倍。这是 MiniMax 首个支持多模态输入的长上下文模型。Vercel 宣布 M3 已上线 AI Gateway，并提供一周 50% 折扣。开发者可以以极低成本获得接近顶级模型的智能体能力。

AI模型 MiniMax M3 开源模型智能体 Next.js 多模态

推荐理由：做 Next.js 智能体开发的团队终于有了高性价比的开源选择——M3 性能接近 Opus 但成本仅 1/10，Vercel 用户现在就能用上，建议立刻试试。

原文

08:14

岚叔@lufzzliz

AI模型 Qwen3.7-Plus 多模态 Agent 工具调用性价比

推荐理由：Qwen3.7-Plus 把多模态 Agent 的实用门槛又拉低了一截，做自动化工作流或 GUI 操作的开发者可以直接关注，性价比和功能覆盖都很能打。

原文

08:13

岚叔@lufzzliz

用户对Qwen3.7-Plus进行了10项测评任务，整体完成度尚可。新加入的测评任务中，倒计时功能出现圈与数字分离的瑕疵，粒子引力场存在页面卡顿bug，拟物相机任务与SOTA模型差距明显，洗车问题相比Qwen3.6-Plus出现倒退。完整测评结果已公开。

AI模型 Qwen3.7-Plus 模型测评通义千问 SOTA差距任务测试

推荐理由：Qwen3.7-Plus在多项任务中表现尚可，但新任务暴露了与SOTA模型的差距，关注通义千问系列进展的开发者可以看看具体哪些场景翻车了。

原文

07:56

Fireworks AI@FireworksAI_HQ

精选76°

StepFun 发布 Step 3.7 Flash，一个 196B 参数的 MoE 模型，从设计之初就针对推理效率进行优化。它采用多矩阵分解注意力（MFA）技术，KV-cache 仅为 DeepSeek 的约 22%，并通过注意力-FFN 解耦（AFD）实现硬件优化的服务。模型在 ClawEval-1.1、SimpleVQA Search 等基准测试中排名第一，支持 400 TPS 的推理速度，256K 上下文窗口，并具备三种推理级别。它专为智能体、编程、搜索和多模态工作流设计，支持本地运行（如 Mac Studio M4 Max），并采用 Apache 2.0 许可证开放权重。

AI模型 Step 3.7 Flash MoE 推理效率 MFA Apache 2.0

推荐理由：Step 3.7 Flash 把推理效率从模型设计阶段就考虑进去，做智能体或搜索应用的团队可以直接在 Fireworks 上试用，成本可能比 DeepSeek 低很多。

原文

01:54

阿里通义 Qwen@Alibaba_Qwen

精选

Qwen3.7-Plus在文本基准测试中展现出竞争力，整体表现逼近Max级别模型。该结果来自Qwen官方发布的性能1测试。目前尚无具体基准和分数细节。

AI模型 Qwen3.7-Plus Qwen Alibaba 文本基准

推荐理由：Qwen新模型性能追平高端

原文

00:45

Patrick Loeber@patloeber

精选

Google 于 6 月 1 日正式停用 Gemini 2.0 Flash 和 Gemini 2.0 Flash-Lite 两款模型。官方推荐用户迁移至 Gemini 3.5 Flash 和 Gemini 3.1 Flash-Lite。此次调整不涉及其他 Gemini 版本。

AI模型 Gemini 2.0 Flash Gemini 3.5 Flash Google 模型升级

推荐理由：旧模型退役，快换新版本

原文

00:27

rohanpaul_ai@rohanpaul_ai

精选76°

Nvidia 将在几天内发布 Nemotron 3 Ultra 模型。该模型采用混合状态空间模型（SSM）与混合专家（MoE）架构，SSM 部分专为长序列设计，使模型能够更长时间地保持推理或使用工具，而不会被常规注意力机制的计算成本压垮。黄仁勋在 NVIDIA GTC Taipei 2026 上宣布了此消息。

AI模型 Nemotron 3 Ultra Nvidia SSM MoE 长序列推理

推荐理由：Nemotron 3 Ultra 的混合 SSM+MoE 架构解决了长序列推理的高成本痛点，做长上下文应用或工具调用的开发者值得关注，可以直接期待其发布。

原文

00:17

Paul Couvert@itsPaulAi

83°

MiniMax 发布开源权重模型 M3，在 SWE-Bench Pro 上达到 59.0%，与 GPT-5.5 持平，并在多项编码基准上与 Opus 4.7 不相上下。M3 还支持 1M 上下文、原生多模态，使用成本仅为 GPT 和 Opus 的十分之一。权重和技术报告将在约 10 天后在 Hugging Face 开放。这标志着开源模型首次在多个前沿能力上追平闭源顶级模型，对 AI 开发者和企业用户意义重大。

AI模型开源/仓库推理模型编程助手 MiniMax M3

推荐理由：开源模型首次在编码和智能体任务上追平 GPT-5.5 和 Opus，成本却低一个数量级。做 AI 应用开发或自建模型的团队，值得关注权重发布后直接试用。

原文

6月1日

18:53

岚叔@lufzzliz

精选76°

MiniMax 发布新一代旗舰模型 M3，面向 coding agent、长上下文和多模态任务。M3 支持 1M 上下文，核心技术创新是 MiniMax Sparse Attention (MSA)，通过稀疏注意力将 KV 分块并精确选取相关块，大幅降低长上下文计算成本。在 1M 上下文下，每 token 计算量仅为上一代的 1/20，prefill 提速 9 倍以上，decode 提速 15 倍以上。M3 支持文本、图片、视频输入，将长上下文、工具调用、多模态理解和持续执行能力整合，明确押注 agentic coding 场景。

AI模型 MiniMax-M3 稀疏注意力长上下文 Agentic Coding 多模态

推荐理由：M3 的稀疏注意力解决了长上下文推理的成本痛点，做 coding agent 和自动化任务的开发者可以直接关注——1M 上下文下计算量骤降 95%，意味着更长的任务链也能跑得动。

原文

18:24

berryxia@berryxia

精选76°

KwaiKeye 在 Hugging Face 开源了多模态模型 Keye VL 2.0-30B-A3B，总参数 30B 但活跃参数仅 3B，采用 Apache 2.0 协议。模型通过 DeepSeek 稀疏注意力实现 256K 上下文，视频理解能力随输入帧数增加而准确率上升，打破长视频导致模型迷失的直觉。在多个长视频基准上，其表现与 Qwen3 VL 和 Gemini 3 Flash 相当。该模型证明了稀疏注意力可同时兼顾长上下文和深度理解，是多模态领域的重要进展。

AI模型多模态模型稀疏注意力开源/仓库视频理解 KwaiKeye

推荐理由：做视频理解或多模态应用的开发者，终于有了一个长上下文和深度理解兼得的开源模型，建议直接去 Hugging Face 下载试试。

原文

15:07

NVIDIA AI@NVIDIAAI

精选

NVIDIA 宣布其 Cosmos 3 模型完全开源，包括模型权重和训练配方。该模型已在 Hugging Face 上发布，供开发者自由使用。此举延续了 NVIDIA 在 AI 领域开放生态的策略，旨在推动更多创新应用。Cosmos 3 的开放将加速研究者和工程师在视觉、语言等多模态任务上的探索。

AI模型开源/仓库多模态模型 NVIDIA Cosmos 3 Hugging Face

推荐理由：NVIDIA 把 Cosmos 3 的权重和训练配方全开源了，做多模态研究的团队可以直接下载使用，省去从头训练的算力成本，值得点开看看。

原文