全部 AI 动态 · AI 热点

6月15日

23:15

23:15IT之家（博客/媒体）

78°

稀宇科技于6月12日开源了 MiniMax M3 模型权重，总参数428B，激活参数23B。M3 是首个从 Step 0 开始进行多模态混合训练的开源模型，支持百万上下文。发布两周后，M3 在 Artificial Analysis 综合智能指数排行榜上获得全球开源模型最高排名。模型输出速度已从30 TPS提升至约80 TPS，后续还将提速30-40%。在编码与智能体评测中达到行业顶尖水平，具备自主任务拆解、工具调用与多步推理能力。

AI模型 MiniMax M3 多模态开源模型百万上下文智能体

推荐理由：MiniMax 开源了原生多模态巨无霸 M3，428B参数、百万上下文，全球开源排名第一，还能自主拆任务调工具，速度从30飙到80 TPS。

原文

23:01

23:01IT之家（博客/媒体）

巴西IplanRIO发布的Rio-3.5-Open-397B模型在多个基准测试取得SOTA，被奉为拉美开源新势力。上海创智学院Nex团队指控该模型套壳阿里千问Qwen3.5和Nex N2 Pro的权重，并展示证据：无系统提示时模型自称“Nex N2 Pro”且提及“上海创智学院”。IplanRIO在Hugging Face致歉，称因操作失误上传了合并基线版本，承诺后续重新上传正式版。

行业 Rio-3.5-Open-397B Qwen3.5 Nex N2 Pro 开源模型模型套壳

推荐理由：巴西公司号称自研的黑马模型，结果是个套壳缝合怪，被扒得底裤都不剩。看看证据有多实锤。

原文

16:13

量子位@思邈

Noiz AI联合香港科技大学和清华大学开源了一款音频生成大模型。该模型仅需4步推理即可生成高质量音频，在单张GPU上推理速度达到0.24秒。其高效架构显著降低了音频生成的计算门槛。开源代码和模型权重已在GitHub发布，支持多种音频生成任务。

AI模型音频生成开源模型 Noiz AI 快速推理

推荐理由：噪点AI和港科大、清华联手做了一个音频模型，4步生成只要0.24秒，比同类快很多，还开源了，想玩音频AI的可以试试。

原文

14:13

marktechpost@Michal Sutter

79°

Z.ai 于 2026 年 6 月 13 日发布 GLM-5.2，覆盖所有 GLM Coding Plan 层级。该模型支持 100 万 token 的可用上下文窗口，并提供 High 和 Max 两种思考努力级别。GLM-5.2 通过 Anthropic 兼容端点集成到 Claude Code、Cline 和 OpenClaw 等工具中。发布时未公布基准测试结果，MIT 开源权重预计下周发布。

AI模型 Z.ai GLM-5.2 长上下文推理模型开源模型

推荐理由：Z.ai 的 GLM-5.2 支持百万token上下文，还能选思考深度

原文

12:58

Cohere@cohere

Cohere 联合创始人 Nick Frosst 在 MTSlive 上警告，订阅专有 LLM 存在风险，强调技术应归用户所有。Cohere 随后发布了新模型 North Mini Code，旨在让用户拥有和控制模型。此模型针对代码任务优化，支持主权使用。

AI模型 Cohere North Mini Code 开源模型代码模型

推荐理由：Cohere 发了开源代码模型

原文

6月14日

16:18

Pandaily@contact@pandaily.com (Pandaily)

72°

智谱AI宣布将GLM-5.2模型以MIT许可证开源，支持100万token上下文长度。此举直接回应美国针对Anthropic模型的出口限制。GLM-5.2在多项基准测试中表现优异，其开源策略旨在推动国内AI生态发展。

AI模型 GLM-5.2 Zhipu AI 开源模型长上下文 MIT许可证

推荐理由：智谱开源百万token模型

原文

16:14

Z.ai (智谱国际)@Zai_org

精选

智谱 AI 发布新旗舰模型 GLM-5.2，现已面向所有 GLM 编程计划用户（包括 Lite、Pro、Max 和 Team 计划）开放。该模型具备强大的编码能力，支持 100 万 token 上下文，并在长周期任务中表现持续强劲。API 和聊天机器人服务将于下周上线，模型也将于下周以 MIT 许可证正式开源。

AI模型 GLM-5.2 智谱AI 开源模型编程助手

推荐理由：智谱开源新旗舰，百万上下文

原文

16:09

Viking@vikingmute

Shadcn 的 /improve 思路主张用最强大的模型（如 GPT-6）深入理解代码库、发现问题并产出高质量计划，而将实际执行交给更便宜的模型完成。Skill 本身绝不直接修改代码，只负责产出计划，主 Skill 包括快速和全面等多种模式。该 repo 发布 4 天即获 3.7K stars，作者认为 skills 是目前最容易获得 stars 的方式。

技巧 shadcn /improve 编程助手开源模型智能体

推荐理由：Shadcn 教你用最强模型出计划

原文

10:52

Clement Delangue@ClementDelangue

Hugging Face CEO Clement Delangue 在推文中强调 AI 发展没有必然性，所有人都有选择权。他对比两条路径：封闭 API 导致权力集中，或开源 AI 让所有人参与。他引用 SemiAnalysis 的案例：里约热内卢市基于 Qwen 7/2 后训练了 Rio 3.5 Open 397B 模型，该模型采用 SwiReasoning 框架，动态切换标准链式推理和隐空间推理，通过熵置信信号提升 token 效率。

行业 Clement Delangue Hugging Face 开源模型 Qwen SwiReasoning

推荐理由：开源 vs 封闭，里约市用 Qwen 做示范

原文

09:52

Geek@geekbb

精选

一个名为 Archify 的开源项目展示了通过 LLM（如 pi 和 DeepSeek）将自然语言描述转换为结构化 JSON，再经 Node.js 渲染器用纯几何算法生成 SVG 并注入自包含 HTML 的流程。该方法无需依赖任何生图模型，仅利用 LLM 的指令遵循能力即可实现从文本到矢量图形的转换。项目代码托管在 GitHub 上，提供了一种轻量级的 AI 绘图新思路。

技巧 DeepSeek pi Archify SVG 开源模型

推荐理由：不用生图模型也能画图

原文

02:22

Paul Couvert@itsPaulAi

PaulAI在推文中强调AI不应被封闭组织垄断，建议使用闭源模型创建技能、工具、数据集和工作流，以改进本地模型。他指出本地AI模型现在易于使用且能力远超预期，可连接Codex、Claude Code等工具实现自动化。用户可根据需要微调这些模型。

技巧开源模型本地模型 Codex Claude Code 微调

推荐理由：教你用闭源模型养本地模型

原文

02:01

lmarena.ai@lmarena_ai

精选

AI模型 Kimi-K2.7-Code Kimi 开源模型编程助手推理模型

推荐理由：Kimi 开源新编程模型，性能全面超越前代

原文

6月13日

23:22

23:22IT之家（博客/媒体）

智谱发布 AI 编程工具 ZCode 3.0，全面切换自研 ZCode Agent 内核，深度适配 GLM-5.2 模型。GLM-5.2 支持 1M 上下文，是智谱迄今能力最强的开源模型。ZCode 3.0 新增分组式任务工作区、Zread 智能项目知识库、可视化 Git 分支图谱等功能。官方表示整体任务完成效果已显著优于第三方 Agent。

AI产品 ZCode GLM-5.2 智谱编程助手开源模型

推荐理由：智谱自研内核，编程体验升级

原文

22:51

量子位@鹭羽

HuggingFace CEO和Bengio团队推荐的HRM模型，参数量仅1B，训练成本仅1500美元。该模型在多个基准测试中表现优于同规模模型，如MMLU上达到45.2%，HellaSwag上达到72.1%。其核心创新在于高效训练方法，大幅降低了资源需求。

AI模型 HRM HuggingFace Bengio 开源模型推理模型

推荐理由：1B模型，1500美元，性能超预期

原文

22:21

Geek@geekbb

精选

智谱AI宣布GLM-5.2完全开源，这是其最强开源模型。该模型支持1M上下文窗口，在长周期任务独立完成方面保持领先，为复杂智能体应用提供基础支持。GLM-5.2也是智谱最强国产编程模型的核心引擎。今晚5:21起，所有GLM编程计划用户（Lite/Pro/Max）均可使用，API下周上线。

AI模型 GLM-5.2 智谱AI 开源模型智能体编程助手

推荐理由：智谱开源最强模型GLM-5.2，1M上下文免费可用

原文

18:22

Thomas Wolf@Thom_Wolf

Thom Wolf在推文中指出，开源模型在AGI时代将成为文明韧性的关键组成部分。他认为，无论任何个体行为者如何决策，开源模型都能确保人类保留对有意义智能水平的访问权。这一观点强调了开源AI在分散控制权和保障集体利益方面的重要性。

行业开源模型 AGI 文明韧性 Thom Wolf

推荐理由：开源模型保障AGI时代人类智能

原文

17:52

orange.ai@oran_ge

Fable 5 模型因美国政府以国家安全为由要求 Anthropic 下架，已从全球范围移除。Kimi 发布开源 coding 模型 K2.7 Code，相比 K2.6 提升 20% 编码能力，思考 token 减少 30%，API 输入 6.5 元、输出 27 元。智谱宣布即将发布 GLM 5.2，强调前沿智能应开放可用。

行业 Fable 5 Anthropic Kimi K2.7 Code GLM 5.2 开源模型

推荐理由：Fable 5 下架，Kimi 和智谱发新模型

原文

17:51

shao__meng@shao__meng

智谱发布GLM-5.2旗舰模型，面向所有GLM Coding Plan用户（Lite、Pro、Max、Team）开放。该模型具备强大编码能力，支持1M上下文，并在长任务处理上持续优化。API和聊天机器人服务将于下周上线，模型也将以MIT许可证正式开源。

AI模型 GLM-5.2 智谱开源模型编码助手 1M上下文

推荐理由：智谱GLM-5.2开源，1M上下文编码强

原文

16:54

Decoder@Matthias Bastian

Moonshot AI 发布了开源模型 Kimi K2.7 Code，拥有 1 万亿参数，专为编程任务设计。在编程基准测试中，Kimi K2.7 Code 仍落后于 GPT-5.5 和 Claude Opus 4.8，但每 token 价格比它们低 12 倍。用户需权衡：在相同预算下，使用 Kimi K2.7 Code 能获得更多推理次数，但质量可能有所下降。

AI模型 Kimi K2.7 Code Moonshot AI GPT-5.5 Claude Opus 4.8 开源模型

推荐理由：编程省钱利器，12倍性价比

原文

16:52

Fireworks AI@FireworksAI_HQ

Fireworks AI 宣布其平台支持 Qwen 3.7 模型，并提供与 OpenAI 和 Anthropic 兼容的 API 端点。该服务可无缝集成到 Claude Code、Cursor、LangChain 等现有工具中。用户可立即使用无服务器版本，并申请 Qwen 3.7 Max 的早期访问。Fireworks AI 还提供定制工作负载支持。

AI产品 Qwen 3.7 Fireworks AI API端点开源模型

推荐理由：Fireworks 让 Qwen 3.7 即插即用

原文

14:36

14:36IT之家（博客/媒体）

智谱宣布 GLM-5.2 将面向 GLM Coding Plan 全量用户开放，覆盖 Lite、Pro、Max 及团队版。该模型支持 1M 上下文，是智谱迄今能力最强的开源模型，在长程任务中保持领先。GLM-5.2 API 将于下周上线，模型将遵循 MIT 协议正式开源。此前智谱于 3 月发布 GLM-5.1，5 月发布输出速度达 400 tokens/s 的 GLM-5.1 高速版。

AI模型 GLM-5.2 智谱开源模型 1M上下文

推荐理由：智谱最强开源模型下周上线

原文

13:17

Amazon Science@AmazonScience

精选

Amazon 研究人员推出 Simple Strands Agent (SSA)，这是一个轻量级开源框架。SSA 在 SWE-Bench-Verified、SWE-Bench-Pro 和 Terminal-Bench2 三个基准上均达到当前最优 (SOTA)。该框架通过缩小模型意图与执行之间的差距来提升性能。SSA 的设计强调简洁与可复现性。

AI模型 Simple Strands Agent Amazon SWE-Bench 开源模型编程助手

推荐理由：轻量开源，三个基准登顶

原文

13:03

marktechpost@Asif Razzaq

Moonshot AI 开源了 Kimi K2.7-Code，这是一个基于 Kimi K2.6 构建的编程智能体模型，采用 Modified MIT 许可证。该模型拥有 256K 上下文窗口，推理 token 使用量降低约 30%。在 Kimi Code Bench v2 上，K2.7-Code 相比 K2.6 提升了 21.8%，并在其他五个基准上也有增长。模型已通过 Kimi API 和 Kimi Code 提供。

AI模型 Kimi K2.7-Code Moonshot AI 编程助手开源模型智能体

推荐理由：编程模型开源，性能提升明显

原文

11:15

ollama@ollama

Kimi-K2.7-Code 是 Kimi 最新开源的编程模型，现已在 Ollama 云上可用，部署于美国 NVIDIA B300 数据中心 GPU。相比 K2.6，该模型在 Kimi Code Bench v2 上提升 21.8%，在 Program Bench 上提升 11.0%，在 MLS Bench Lite 上提升 31.5%。推理 token 使用量降低 30%，减少过度思考。支持长周期编码任务，指令遵循能力更强。

AI模型 Kimi-K2.7-Code Ollama 编程助手开源模型 NVIDIA B300

推荐理由：Kimi 新编程模型上线 Ollama，性能大涨

原文

11:05

lmarena.ai@lmarena_ai

精选

NVIDIA 的 Nemotron 3 Ultra 在 Agent Arena 排行榜上位列第20名，在开源模型中排第5。该模型在用户表扬与投诉的净差值和工具幻觉率方面表现突出，但在可操控性和 bash 恢复能力上存在短板。排行榜基于30万+任务、200万+工具调用和4000万行代码的评测数据。当前分数置信区间较宽，排名仍在稳定中。

AI模型 Nemotron 3 Ultra NVIDIA Agent Arena 开源模型智能体

推荐理由：NVIDIA 开源模型在智能体评测中排第5

原文

10:55

MiniMax_AI@MiniMax_AI

精选

MiniMax 发布 M3 模型，总参数量约 428B，激活参数约 23B。该模型在编码、长周期智能体和原生多模态（文本、图像、视频）任务上表现优异，支持 1M token 上下文长度。M3 以开源权重形式发布，在 Baseten 平台可运行。

AI模型 MiniMax M3 开源模型多模态智能体

推荐理由：开源模型能打编码和多模态

原文

10:53

Together AI@togethercompute

精选

MiniMax 发布开源权重原生多模态模型 MiniMax-M3，具备 1M 上下文窗口和 MiniMax 稀疏注意力机制。模型提供思考与非思考两种模式。Together AI 作为首选云合作伙伴，通过推理优化在并发场景下实现高达 125% 的吞吐量提升。

AI模型 MiniMax-M3 Together AI 多模态开源模型 1M上下文

推荐理由：MiniMax 新模型上线，吞吐量提升 125%

原文

10:18

berryxia@berryxia

精选73°

Kimi 发布 K2.7-Code 模型，开源权重和代码至 Hugging Face。相比上一代，token 消耗减少 30%，agent 长任务成功率提升。在 Kimi Code Bench v2 上提升 21.8%，Program Bench 提升 11%，MLS Bench Lite 提升 31.5%。模型通过高效推理解决 coding model 过度思考问题，并预告 6x High-Speed Mode。

AI模型 Kimi K2.7-Code 开源模型编程助手推理模型

推荐理由：Kimi 开源新模型，少烧 token 还能干更多活

原文

09:44

orange.ai@oran_ge

开发者 oran_ge 用 Claude Fable 5 打磨文案三遍，发现改后文字虽更讲究但人味儿递减。经讨论，将缺失归结为“存在感”——文字背后缺乏具体的人与代价。据此制作《人味儿写作心法.skill》并开源发布，专用于 AI 改稿场景，帮助保留文字的人味儿。

技巧 Claude Fable 5 提示词工程开源模型写作

推荐理由：开源技能让 AI 改稿保留人味儿

原文

6月12日

22:47

vLLM@vllm_project

73°

MiniMax AI 发布了新一代开源模型 MiniMax M3，具备前沿的编码和智能体能力，原生支持图像和视频输入、计算机使用功能，并拥有 100 万 token 的上下文窗口。其核心是 MSA（MiniMax Sparse Attention）稀疏注意力架构，通过仅对 top 128-token KV 块进行注意力计算，大幅降低了长上下文推理的计算成本。M3 已在 vLLM 中实现首日支持，可在 NVIDIA 和 AMD 硬件上运行，支持 BF16 和 MXFP8 检查点、MoE 后端、多模态输入、工具调用和推理控制。这一成果是 MiniMax、NVIDIA、AMD 和 vLLM 社区合作的结晶。

AI模型 MiniMax M3 稀疏注意力 1M上下文开源模型 vLLM

推荐理由：M3 的 1M 上下文和稀疏注意力架构解决了长文档和复杂智能体任务的性能瓶颈，做 RAG、代码分析和自动化工作流的团队可以直接在 vLLM 上部署试用。

原文

17:56

shao__meng@shao__meng

精选

在华为开发者大会HDC 2026上，余承东宣布开源盘古模型全面升级，推出openPangu 2.0版本。该版本在性能、效率等方面进行了优化，具体改进细节尚未公布。余承东强调团队将保持领先，持续追赶行业前沿。

AI模型 openPangu 华为盘古开源模型

推荐理由：华为开源盘古2.0来了

原文

15:07

15:07IT之家（博客/媒体）

73°

华为在 HDC 2026 上正式发布开源盘古 openPangu 2.0 模型，包含 Pro（505B 总参数/18B 激活）和 Flash（92B 总参数/6B 激活）两个版本，支持 512K 上下文。该模型针对昇腾算力优化，单卡吞吐率是业界主流开源模型的 2 倍，并适配鸿蒙系统，在 Agent 任务上更快更准更省。华为计划从 6 月 30 日起陆续开源 7 大组件，包括预训练代码、后训练代码和训练算子。余承东坦言，由于算力大量支持国内其他企业，华为自留算力有限，因此模型参数规模控制在 505B，更聚焦时延和吞吐率提升。

AI模型华为盘古 2.0 开源模型昇腾鸿蒙

推荐理由：华为开源盘古 2.0 解决了国产大模型在昇腾生态下的部署效率问题，使用昇腾算力的开发者和企业可以直接受益，建议关注 6 月 30 日的开源组件发布。

原文

05:29

Cohere@cohere

精选

Cohere 在两天前发布了其首个开源编程模型 North Mini Code。该模型专为代码生成和编程任务设计，可免费使用。开发者已开始利用它构建各种应用，社区反响积极。

AI模型 North Mini Code Cohere 开源模型编程助手

推荐理由：Cohere 出了个免费编程模型

原文

00:26

SiliconFlowAI@siliconflowai

精选

NousResearch 推出了 Hermes Agent Desktop，这是一款桌面端智能体工具，允许用户通过 SiliconFlow 平台一键切换多种前沿开源模型，包括 DeepSeek-V4、GLM-5.1、Kimi-K2.6 和 MiniMax-M3 等。该工具旨在降低使用开源模型的复杂度，让开发者无需手动配置即可快速体验不同模型的能力。SiliconFlow 作为底层推理平台，提供了统一的 API 和模型管理功能，进一步简化了部署流程。这一发布意味着开源模型生态在易用性上迈出了重要一步，尤其适合需要频繁对比或切换模型的 AI 应用开发者。

AI产品智能体开源模型模型切换 NousResearch SiliconFlow

推荐理由：做 AI 应用或智能体开发的团队终于可以像换 App 一样切换开源模型了——Hermes Agent Desktop 把模型切换成本降到零，建议直接上手试试。

原文

6月11日

03:39

Decoder@Jonathan Kemper

72°

Google 发布了 DiffusionGemma，一个 260 亿参数的开源模型。它不采用传统的逐词生成方式，而是通过扩散过程从噪声中生成文本，类似于图像 AI 的工作方式。据 Nvidia 称，该模型在单个 H100 GPU 上每秒可处理约 1000 个 token，速度是同类自回归模型的约 4 倍。但输出质量较低，因此 Google 目前将其定位为面向开发者的实验性工具。

AI模型 Google DiffusionGemma 扩散模型开源模型推理加速

推荐理由：DiffusionGemma 为文本生成开辟了新路径，追求推理速度的开发者可以尝试这种非自回归方案，尤其适合对实时性要求高的场景。

原文

03:20

Clement Delangue@ClementDelangue

Hugging Face 联合创始人 Clement Delangue 在 X 上发起讨论，询问是否应该尝试训练一个开源 AI 建筑模型。他指出 Hugging Face 拥有丰富的相关数据集，包括 HF、MLintern、transformers、trl 等。该提议引发了社区关注，获得 36 条评论、6 次转发、150 个赞和 4284 次浏览。这表明开源 AI 在建筑领域的应用潜力正受到关注，可能推动建筑行业智能化发展。

行业开源模型建筑行业 Hugging Face 数据集 AI 应用

推荐理由：Hugging Face 联合创始人的提议直击开源 AI 在垂直领域的落地机会，建筑行业的开发者或研究者可以关注这个方向，看看能否用现有数据集推动创新。

原文

03:06

NVIDIA AI@NVIDIAAI

76°

Google DeepMind 推出实验性开源模型 DiffusionGemma，采用文本扩散技术，每步并行生成 256 个 token，推理速度可达 150+ TPS（DGX Spark）或 1000+ TPS（单张 H100）。该模型激活仅 3.8B 参数，量化后可在 24GB VRAM 消费级 GPU 上运行，适合代码填充、内联编辑等非线性任务。NVIDIA 从首日起提供 BF16/NVFP4 检查点、免费 GPU 加速端点及 vLLM 支持。DiffusionGemma 优先速度而非极致质量，生产场景仍推荐标准 Gemma 4。

AI模型文本扩散并行生成开源模型 Google DeepMind NVIDIA

推荐理由：文本扩散模型把生成速度拉到新高度，做代码补全或实时编辑的开发者可以直接在 NVIDIA 端点试跑，感受并行 token 的爽感。

原文

02:54

marktechpost@Asif Razzaq

76°

Google DeepMind 推出 DiffusionGemma，一款 26B 参数的混合专家（MoE）开源模型，采用文本扩散技术，在 GPU 上生成速度最高提升 4 倍。该模型在保持生成质量的同时，显著降低了推理延迟，适合对实时性要求高的场景。DiffusionGemma 已开源，开发者可直接下载使用。

AI模型 DiffusionGemma Google DeepMind MoE 文本扩散开源模型

推荐理由：做文本生成或实时 AI 应用的开发者，这个模型用扩散方法把生成速度翻了 4 倍，值得下载实测。

原文

01:46

elvis@omarsar0

AI 研究员 Omar 指出，随着超级强大的 AI 模型即将发布，当前最大的错误是锁定单一供应商。他建议从成本和工程角度出发，规划如何利用多种模型组合，包括开源模型。通过模型路由（routing）将任务分配给最适合的模型，能获得灵活性、数据控制权和用例自由。这对 AI 工程师和研究者来说，是未来工程化的关键策略。

行业模型锁定模型路由开源模型 AI 工程供应商策略

推荐理由：Omar 点破了模型锁定的风险，做 AI 工程和选型的团队值得花时间规划模型路由策略，避免被单一供应商绑架。

原文

6月10日

23:46

elvis@omarsar0

Elvis 在推文中警告，未来几周将发布超级强大的 AI 模型，可能带来能力阶跃变化。他建议不要锁定单一供应商，而应从工程角度考虑如何组合使用多种模型（包括开源模型），以便随时切换并利用各自优势。对于编程智能体，开源模型已与前沿模型相当。他推荐将 AI 模型路由作为工程重点，以高效分配任务。

行业 AI模型模型路由开源模型编程智能体供应商锁定

推荐理由：Elvis 点出了 AI 模型即将爆发的关键节点，做 AI 工程和智能体开发的团队应该立刻开始规划模型路由策略，避免被单一供应商绑定。

原文