23:15IT之家(博客/媒体)78°稀宇科技于6月12日开源了 MiniMax M3 模型权重,总参数428B,激活参数23B。M3 是首个从 Step 0 开始进行多模态混合训练的开源模型,支持百万上下文。发布两周后,M3 在 Artificial Analysis 综合智能指数排行榜上获得全球开源模型最高排名。模型输出速度已从30 TPS提升至约80 TPS,后续还将提速30-40%。在编码与智能体评测中达到行业顶尖水平,具备自主任务拆解、工具调用与多步推理能力。AI模型MiniMax M3多模态开源模型百万上下文智能体2 个信源在谈推荐理由:MiniMax 开源了原生多模态巨无霸 M3,428B参数、百万上下文,全球开源排名第一,还能自主拆任务调工具,速度从30飙到80 TPS。原文
23:01IT之家(博客/媒体)巴西IplanRIO发布的Rio-3.5-Open-397B模型在多个基准测试取得SOTA,被奉为拉美开源新势力。上海创智学院Nex团队指控该模型套壳阿里千问Qwen3.5和Nex N2 Pro的权重,并展示证据:无系统提示时模型自称“Nex N2 Pro”且提及“上海创智学院”。IplanRIO在Hugging Face致歉,称因操作失误上传了合并基线版本,承诺后续重新上传正式版。行业Rio-3.5-Open-397BQwen3.5Nex N2 Pro开源模型模型套壳1 个信源在谈推荐理由:巴西公司号称自研的黑马模型,结果是个套壳缝合怪,被扒得底裤都不剩。看看证据有多实锤。原文
16:13量子位@思邈Noiz AI联合香港科技大学和清华大学开源了一款音频生成大模型。该模型仅需4步推理即可生成高质量音频,在单张GPU上推理速度达到0.24秒。其高效架构显著降低了音频生成的计算门槛。开源代码和模型权重已在GitHub发布,支持多种音频生成任务。AI模型音频生成开源模型Noiz AI快速推理推荐理由:噪点AI和港科大、清华联手做了一个音频模型,4步生成只要0.24秒,比同类快很多,还开源了,想玩音频AI的可以试试。原文
14:13marktechpost@Michal Sutter79°Z.ai 于 2026 年 6 月 13 日发布 GLM-5.2,覆盖所有 GLM Coding Plan 层级。该模型支持 100 万 token 的可用上下文窗口,并提供 High 和 Max 两种思考努力级别。GLM-5.2 通过 Anthropic 兼容端点集成到 Claude Code、Cline 和 OpenClaw 等工具中。发布时未公布基准测试结果,MIT 开源权重预计下周发布。AI模型Z.aiGLM-5.2长上下文推理模型开源模型10 个信源在谈推荐理由:Z.ai 的 GLM-5.2 支持百万token上下文,还能选思考深度原文
12:58Cohere@cohereCohere 联合创始人 Nick Frosst 在 MTSlive 上警告,订阅专有 LLM 存在风险,强调技术应归用户所有。Cohere 随后发布了新模型 North Mini Code,旨在让用户拥有和控制模型。此模型针对代码任务优化,支持主权使用。AI模型CohereNorth Mini Code开源模型代码模型推荐理由:Cohere 发了开源代码模型原文
16:18Pandaily@contact@pandaily.com (Pandaily)72°智谱AI宣布将GLM-5.2模型以MIT许可证开源,支持100万token上下文长度。此举直接回应美国针对Anthropic模型的出口限制。GLM-5.2在多项基准测试中表现优异,其开源策略旨在推动国内AI生态发展。AI模型GLM-5.2Zhipu AI开源模型长上下文MIT许可证10 个信源在谈推荐理由:智谱开源百万token模型原文
16:14Z.ai (智谱国际)@Zai_org精选智谱 AI 发布新旗舰模型 GLM-5.2,现已面向所有 GLM 编程计划用户(包括 Lite、Pro、Max 和 Team 计划)开放。该模型具备强大的编码能力,支持 100 万 token 上下文,并在长周期任务中表现持续强劲。API 和聊天机器人服务将于下周上线,模型也将于下周以 MIT 许可证正式开源。AI模型GLM-5.2智谱AI开源模型编程助手2 个信源在谈推荐理由:智谱开源新旗舰,百万上下文原文
16:09Viking@vikingmuteShadcn 的 /improve 思路主张用最强大的模型(如 GPT-6)深入理解代码库、发现问题并产出高质量计划,而将实际执行交给更便宜的模型完成。Skill 本身绝不直接修改代码,只负责产出计划,主 Skill 包括快速和全面等多种模式。该 repo 发布 4 天即获 3.7K stars,作者认为 skills 是目前最容易获得 stars 的方式。技巧shadcn/improve编程助手开源模型智能体1 个信源在谈推荐理由:Shadcn 教你用最强模型出计划原文
10:52Clement Delangue@ClementDelangueHugging Face CEO Clement Delangue 在推文中强调 AI 发展没有必然性,所有人都有选择权。他对比两条路径:封闭 API 导致权力集中,或开源 AI 让所有人参与。他引用 SemiAnalysis 的案例:里约热内卢市基于 Qwen 7/2 后训练了 Rio 3.5 Open 397B 模型,该模型采用 SwiReasoning 框架,动态切换标准链式推理和隐空间推理,通过熵置信信号提升 token 效率。行业Clement DelangueHugging Face开源模型QwenSwiReasoning推荐理由:开源 vs 封闭,里约市用 Qwen 做示范原文
09:52Geek@geekbb精选一个名为 Archify 的开源项目展示了通过 LLM(如 pi 和 DeepSeek)将自然语言描述转换为结构化 JSON,再经 Node.js 渲染器用纯几何算法生成 SVG 并注入自包含 HTML 的流程。该方法无需依赖任何生图模型,仅利用 LLM 的指令遵循能力即可实现从文本到矢量图形的转换。项目代码托管在 GitHub 上,提供了一种轻量级的 AI 绘图新思路。技巧DeepSeekpiArchifySVG开源模型推荐理由:不用生图模型也能画图原文
02:22Paul Couvert@itsPaulAiPaulAI在推文中强调AI不应被封闭组织垄断,建议使用闭源模型创建技能、工具、数据集和工作流,以改进本地模型。他指出本地AI模型现在易于使用且能力远超预期,可连接Codex、Claude Code等工具实现自动化。用户可根据需要微调这些模型。技巧开源模型本地模型CodexClaude Code微调推荐理由:教你用闭源模型养本地模型原文
02:01lmarena.ai@lmarena_ai精选Kimi 发布并开源了最新编程模型 Kimi-K2.7-Code,相比 K2.6 在 Kimi Code Bench v2 上提升 21.8%,在 Program Bench 上提升 11.0%,在 MLS Bench Lite 上提升 31.5%。推理效率优化,推理 token 使用量降低 30%。支持长程编程任务,指令遵循和端到端成功率更高。模型已通过 Kimi API 和 Kimi Code 提供。AI模型Kimi-K2.7-CodeKimi开源模型编程助手推理模型5 个信源在谈推荐理由:Kimi 开源新编程模型,性能全面超越前代原文
23:22IT之家(博客/媒体)智谱发布 AI 编程工具 ZCode 3.0,全面切换自研 ZCode Agent 内核,深度适配 GLM-5.2 模型。GLM-5.2 支持 1M 上下文,是智谱迄今能力最强的开源模型。ZCode 3.0 新增分组式任务工作区、Zread 智能项目知识库、可视化 Git 分支图谱等功能。官方表示整体任务完成效果已显著优于第三方 Agent。AI产品ZCodeGLM-5.2智谱编程助手开源模型推荐理由:智谱自研内核,编程体验升级原文
22:51量子位@鹭羽HuggingFace CEO和Bengio团队推荐的HRM模型,参数量仅1B,训练成本仅1500美元。该模型在多个基准测试中表现优于同规模模型,如MMLU上达到45.2%,HellaSwag上达到72.1%。其核心创新在于高效训练方法,大幅降低了资源需求。AI模型HRMHuggingFaceBengio开源模型推理模型推荐理由:1B模型,1500美元,性能超预期原文
22:21Geek@geekbb精选智谱AI宣布GLM-5.2完全开源,这是其最强开源模型。该模型支持1M上下文窗口,在长周期任务独立完成方面保持领先,为复杂智能体应用提供基础支持。GLM-5.2也是智谱最强国产编程模型的核心引擎。今晚5:21起,所有GLM编程计划用户(Lite/Pro/Max)均可使用,API下周上线。AI模型GLM-5.2智谱AI开源模型智能体编程助手2 个信源在谈推荐理由:智谱开源最强模型GLM-5.2,1M上下文免费可用原文
18:22Thomas Wolf@Thom_WolfThom Wolf在推文中指出,开源模型在AGI时代将成为文明韧性的关键组成部分。他认为,无论任何个体行为者如何决策,开源模型都能确保人类保留对有意义智能水平的访问权。这一观点强调了开源AI在分散控制权和保障集体利益方面的重要性。行业开源模型AGI文明韧性Thom Wolf推荐理由:开源模型保障AGI时代人类智能原文
17:52orange.ai@oran_geFable 5 模型因美国政府以国家安全为由要求 Anthropic 下架,已从全球范围移除。Kimi 发布开源 coding 模型 K2.7 Code,相比 K2.6 提升 20% 编码能力,思考 token 减少 30%,API 输入 6.5 元、输出 27 元。智谱宣布即将发布 GLM 5.2,强调前沿智能应开放可用。行业Fable 5AnthropicKimiK2.7 CodeGLM 5.2开源模型10 个信源在谈推荐理由:Fable 5 下架,Kimi 和智谱发新模型原文
17:51shao__meng@shao__meng智谱发布GLM-5.2旗舰模型,面向所有GLM Coding Plan用户(Lite、Pro、Max、Team)开放。该模型具备强大编码能力,支持1M上下文,并在长任务处理上持续优化。API和聊天机器人服务将于下周上线,模型也将以MIT许可证正式开源。AI模型GLM-5.2智谱开源模型编码助手1M上下文推荐理由:智谱GLM-5.2开源,1M上下文编码强原文
16:54Decoder@Matthias BastianMoonshot AI 发布了开源模型 Kimi K2.7 Code,拥有 1 万亿参数,专为编程任务设计。在编程基准测试中,Kimi K2.7 Code 仍落后于 GPT-5.5 和 Claude Opus 4.8,但每 token 价格比它们低 12 倍。用户需权衡:在相同预算下,使用 Kimi K2.7 Code 能获得更多推理次数,但质量可能有所下降。AI模型Kimi K2.7 CodeMoonshot AIGPT-5.5Claude Opus 4.8开源模型7 个信源在谈推荐理由:编程省钱利器,12倍性价比原文
16:52Fireworks AI@FireworksAI_HQFireworks AI 宣布其平台支持 Qwen 3.7 模型,并提供与 OpenAI 和 Anthropic 兼容的 API 端点。该服务可无缝集成到 Claude Code、Cursor、LangChain 等现有工具中。用户可立即使用无服务器版本,并申请 Qwen 3.7 Max 的早期访问。Fireworks AI 还提供定制工作负载支持。AI产品Qwen 3.7Fireworks AIAPI端点开源模型10 个信源在谈推荐理由:Fireworks 让 Qwen 3.7 即插即用原文
14:36IT之家(博客/媒体)智谱宣布 GLM-5.2 将面向 GLM Coding Plan 全量用户开放,覆盖 Lite、Pro、Max 及团队版。该模型支持 1M 上下文,是智谱迄今能力最强的开源模型,在长程任务中保持领先。GLM-5.2 API 将于下周上线,模型将遵循 MIT 协议正式开源。此前智谱于 3 月发布 GLM-5.1,5 月发布输出速度达 400 tokens/s 的 GLM-5.1 高速版。AI模型GLM-5.2智谱开源模型1M上下文推荐理由:智谱最强开源模型下周上线原文
13:17Amazon Science@AmazonScience精选Amazon 研究人员推出 Simple Strands Agent (SSA),这是一个轻量级开源框架。SSA 在 SWE-Bench-Verified、SWE-Bench-Pro 和 Terminal-Bench2 三个基准上均达到当前最优 (SOTA)。该框架通过缩小模型意图与执行之间的差距来提升性能。SSA 的设计强调简洁与可复现性。AI模型Simple Strands AgentAmazonSWE-Bench开源模型编程助手1 个信源在谈推荐理由:轻量开源,三个基准登顶原文
13:03marktechpost@Asif RazzaqMoonshot AI 开源了 Kimi K2.7-Code,这是一个基于 Kimi K2.6 构建的编程智能体模型,采用 Modified MIT 许可证。该模型拥有 256K 上下文窗口,推理 token 使用量降低约 30%。在 Kimi Code Bench v2 上,K2.7-Code 相比 K2.6 提升了 21.8%,并在其他五个基准上也有增长。模型已通过 Kimi API 和 Kimi Code 提供。AI模型Kimi K2.7-CodeMoonshot AI编程助手开源模型智能体6 个信源在谈推荐理由:编程模型开源,性能提升明显原文
11:15ollama@ollamaKimi-K2.7-Code 是 Kimi 最新开源的编程模型,现已在 Ollama 云上可用,部署于美国 NVIDIA B300 数据中心 GPU。相比 K2.6,该模型在 Kimi Code Bench v2 上提升 21.8%,在 Program Bench 上提升 11.0%,在 MLS Bench Lite 上提升 31.5%。推理 token 使用量降低 30%,减少过度思考。支持长周期编码任务,指令遵循能力更强。AI模型Kimi-K2.7-CodeOllama编程助手开源模型NVIDIA B30010 个信源在谈推荐理由:Kimi 新编程模型上线 Ollama,性能大涨原文
11:05lmarena.ai@lmarena_ai精选NVIDIA 的 Nemotron 3 Ultra 在 Agent Arena 排行榜上位列第20名,在开源模型中排第5。该模型在用户表扬与投诉的净差值和工具幻觉率方面表现突出,但在可操控性和 bash 恢复能力上存在短板。排行榜基于30万+任务、200万+工具调用和4000万行代码的评测数据。当前分数置信区间较宽,排名仍在稳定中。AI模型Nemotron 3 UltraNVIDIAAgent Arena开源模型智能体10 个信源在谈推荐理由:NVIDIA 开源模型在智能体评测中排第5原文
10:55MiniMax_AI@MiniMax_AI精选MiniMax 发布 M3 模型,总参数量约 428B,激活参数约 23B。该模型在编码、长周期智能体和原生多模态(文本、图像、视频)任务上表现优异,支持 1M token 上下文长度。M3 以开源权重形式发布,在 Baseten 平台可运行。AI模型MiniMaxM3开源模型多模态智能体推荐理由:开源模型能打编码和多模态原文
10:53Together AI@togethercompute精选MiniMax 发布开源权重原生多模态模型 MiniMax-M3,具备 1M 上下文窗口和 MiniMax 稀疏注意力机制。模型提供思考与非思考两种模式。Together AI 作为首选云合作伙伴,通过推理优化在并发场景下实现高达 125% 的吞吐量提升。AI模型MiniMax-M3Together AI多模态开源模型1M上下文7 个信源在谈推荐理由:MiniMax 新模型上线,吞吐量提升 125%原文
10:18berryxia@berryxia精选73°Kimi 发布 K2.7-Code 模型,开源权重和代码至 Hugging Face。相比上一代,token 消耗减少 30%,agent 长任务成功率提升。在 Kimi Code Bench v2 上提升 21.8%,Program Bench 提升 11%,MLS Bench Lite 提升 31.5%。模型通过高效推理解决 coding model 过度思考问题,并预告 6x High-Speed Mode。AI模型KimiK2.7-Code开源模型编程助手推理模型推荐理由:Kimi 开源新模型,少烧 token 还能干更多活原文
09:44orange.ai@oran_ge开发者 oran_ge 用 Claude Fable 5 打磨文案三遍,发现改后文字虽更讲究但人味儿递减。经讨论,将缺失归结为“存在感”——文字背后缺乏具体的人与代价。据此制作《人味儿写作心法.skill》并开源发布,专用于 AI 改稿场景,帮助保留文字的人味儿。技巧Claude Fable 5提示词工程开源模型写作10 个信源在谈推荐理由:开源技能让 AI 改稿保留人味儿原文
22:47vLLM@vllm_project73°MiniMax AI 发布了新一代开源模型 MiniMax M3,具备前沿的编码和智能体能力,原生支持图像和视频输入、计算机使用功能,并拥有 100 万 token 的上下文窗口。其核心是 MSA(MiniMax Sparse Attention)稀疏注意力架构,通过仅对 top 128-token KV 块进行注意力计算,大幅降低了长上下文推理的计算成本。M3 已在 vLLM 中实现首日支持,可在 NVIDIA 和 AMD 硬件上运行,支持 BF16 和 MXFP8 检查点、MoE 后端、多模态输入、工具调用和推理控制。这一成果是 MiniMax、NVIDIA、AMD 和 vLLM 社区合作的结晶。AI模型MiniMax M3稀疏注意力1M上下文开源模型vLLM10 个信源在谈推荐理由:M3 的 1M 上下文和稀疏注意力架构解决了长文档和复杂智能体任务的性能瓶颈,做 RAG、代码分析和自动化工作流的团队可以直接在 vLLM 上部署试用。原文
17:56shao__meng@shao__meng精选在华为开发者大会HDC 2026上,余承东宣布开源盘古模型全面升级,推出openPangu 2.0版本。该版本在性能、效率等方面进行了优化,具体改进细节尚未公布。余承东强调团队将保持领先,持续追赶行业前沿。AI模型openPangu华为盘古开源模型推荐理由:华为开源盘古2.0来了原文
15:07IT之家(博客/媒体)73°华为在 HDC 2026 上正式发布开源盘古 openPangu 2.0 模型,包含 Pro(505B 总参数/18B 激活)和 Flash(92B 总参数/6B 激活)两个版本,支持 512K 上下文。该模型针对昇腾算力优化,单卡吞吐率是业界主流开源模型的 2 倍,并适配鸿蒙系统,在 Agent 任务上更快更准更省。华为计划从 6 月 30 日起陆续开源 7 大组件,包括预训练代码、后训练代码和训练算子。余承东坦言,由于算力大量支持国内其他企业,华为自留算力有限,因此模型参数规模控制在 505B,更聚焦时延和吞吐率提升。AI模型华为盘古 2.0开源模型昇腾鸿蒙推荐理由:华为开源盘古 2.0 解决了国产大模型在昇腾生态下的部署效率问题,使用昇腾算力的开发者和企业可以直接受益,建议关注 6 月 30 日的开源组件发布。原文
05:29Cohere@cohere精选Cohere 在两天前发布了其首个开源编程模型 North Mini Code。该模型专为代码生成和编程任务设计,可免费使用。开发者已开始利用它构建各种应用,社区反响积极。AI模型North Mini CodeCohere开源模型编程助手3 个信源在谈推荐理由:Cohere 出了个免费编程模型原文
00:26SiliconFlowAI@siliconflowai精选NousResearch 推出了 Hermes Agent Desktop,这是一款桌面端智能体工具,允许用户通过 SiliconFlow 平台一键切换多种前沿开源模型,包括 DeepSeek-V4、GLM-5.1、Kimi-K2.6 和 MiniMax-M3 等。该工具旨在降低使用开源模型的复杂度,让开发者无需手动配置即可快速体验不同模型的能力。SiliconFlow 作为底层推理平台,提供了统一的 API 和模型管理功能,进一步简化了部署流程。这一发布意味着开源模型生态在易用性上迈出了重要一步,尤其适合需要频繁对比或切换模型的 AI 应用开发者。AI产品智能体开源模型模型切换NousResearchSiliconFlow7 个信源在谈推荐理由:做 AI 应用或智能体开发的团队终于可以像换 App 一样切换开源模型了——Hermes Agent Desktop 把模型切换成本降到零,建议直接上手试试。原文
03:39Decoder@Jonathan Kemper72°Google 发布了 DiffusionGemma,一个 260 亿参数的开源模型。它不采用传统的逐词生成方式,而是通过扩散过程从噪声中生成文本,类似于图像 AI 的工作方式。据 Nvidia 称,该模型在单个 H100 GPU 上每秒可处理约 1000 个 token,速度是同类自回归模型的约 4 倍。但输出质量较低,因此 Google 目前将其定位为面向开发者的实验性工具。AI模型GoogleDiffusionGemma扩散模型开源模型推理加速10 个信源在谈推荐理由:DiffusionGemma 为文本生成开辟了新路径,追求推理速度的开发者可以尝试这种非自回归方案,尤其适合对实时性要求高的场景。原文
03:20Clement Delangue@ClementDelangueHugging Face 联合创始人 Clement Delangue 在 X 上发起讨论,询问是否应该尝试训练一个开源 AI 建筑模型。他指出 Hugging Face 拥有丰富的相关数据集,包括 HF、MLintern、transformers、trl 等。该提议引发了社区关注,获得 36 条评论、6 次转发、150 个赞和 4284 次浏览。这表明开源 AI 在建筑领域的应用潜力正受到关注,可能推动建筑行业智能化发展。行业开源模型建筑行业Hugging Face数据集AI 应用推荐理由:Hugging Face 联合创始人的提议直击开源 AI 在垂直领域的落地机会,建筑行业的开发者或研究者可以关注这个方向,看看能否用现有数据集推动创新。原文
03:06NVIDIA AI@NVIDIAAI76°Google DeepMind 推出实验性开源模型 DiffusionGemma,采用文本扩散技术,每步并行生成 256 个 token,推理速度可达 150+ TPS(DGX Spark)或 1000+ TPS(单张 H100)。该模型激活仅 3.8B 参数,量化后可在 24GB VRAM 消费级 GPU 上运行,适合代码填充、内联编辑等非线性任务。NVIDIA 从首日起提供 BF16/NVFP4 检查点、免费 GPU 加速端点及 vLLM 支持。DiffusionGemma 优先速度而非极致质量,生产场景仍推荐标准 Gemma 4。AI模型文本扩散并行生成开源模型Google DeepMindNVIDIA10 个信源在谈推荐理由:文本扩散模型把生成速度拉到新高度,做代码补全或实时编辑的开发者可以直接在 NVIDIA 端点试跑,感受并行 token 的爽感。原文
02:54marktechpost@Asif Razzaq76°Google DeepMind 推出 DiffusionGemma,一款 26B 参数的混合专家(MoE)开源模型,采用文本扩散技术,在 GPU 上生成速度最高提升 4 倍。该模型在保持生成质量的同时,显著降低了推理延迟,适合对实时性要求高的场景。DiffusionGemma 已开源,开发者可直接下载使用。AI模型DiffusionGemmaGoogle DeepMindMoE文本扩散开源模型推荐理由:做文本生成或实时 AI 应用的开发者,这个模型用扩散方法把生成速度翻了 4 倍,值得下载实测。原文
01:46elvis@omarsar0AI 研究员 Omar 指出,随着超级强大的 AI 模型即将发布,当前最大的错误是锁定单一供应商。他建议从成本和工程角度出发,规划如何利用多种模型组合,包括开源模型。通过模型路由(routing)将任务分配给最适合的模型,能获得灵活性、数据控制权和用例自由。这对 AI 工程师和研究者来说,是未来工程化的关键策略。行业模型锁定模型路由开源模型AI 工程供应商策略推荐理由:Omar 点破了模型锁定的风险,做 AI 工程和选型的团队值得花时间规划模型路由策略,避免被单一供应商绑架。原文
23:46elvis@omarsar0Elvis 在推文中警告,未来几周将发布超级强大的 AI 模型,可能带来能力阶跃变化。他建议不要锁定单一供应商,而应从工程角度考虑如何组合使用多种模型(包括开源模型),以便随时切换并利用各自优势。对于编程智能体,开源模型已与前沿模型相当。他推荐将 AI 模型路由作为工程重点,以高效分配任务。行业AI模型模型路由开源模型编程智能体供应商锁定推荐理由:Elvis 点出了 AI 模型即将爆发的关键节点,做 AI 工程和智能体开发的团队应该立刻开始规划模型路由策略,避免被单一供应商绑定。原文