全部 AI 动态 · AI 热点

6月30日

12:31

12:31IT之家（博客/媒体）

73°

华为于6月30日正式开源 openPangu-2.0-Flash 模型，总参数量92B，激活参数量6B，支持512K上下文长度。该模型基于昇腾原生训练与推理技术开发，旨在为业界提供最佳实践参考。同时，计划于7月开源 openPangu-2.0-Pro 模型，总参数量505B，激活参数量18B。开源内容包括模型权重、基础推理代码、训推算子以及预训练和后训练代码。

AI模型 openPangu 华为盘古开源模型 512K上下文

推荐理由：华为把92B参数的Flash模型开源了，512K上下文，还有505B的Pro版下月来，搞Agent底座的别错过。

原文

01:17

01:17Simon Willison’s Weblog（博客/媒体）

精选

DeepReinforce 发布 Ornith-1.0，一款 MIT 许可的开源模型，基于 Gemma 4 和 Qwen 3.5 预训练。提供 9B Dense、31B Dense、35B MoE 和 397B MoE 四种规格。在编码基准上达到同尺寸开源模型 SOTA。作者在 LM Studio 上测试 35B Q4_K_M GGUF 版本，能流畅运行代理工具调用并处理代码定位任务。

AI模型 Ornith-1.0 DeepReinforce Gemma 4 Qwen 3.5 开源模型

推荐理由：DeepReinforce 新出的开源编码模型，基于 Gemma 4 和 Qwen 3.5，在代理编码任务上表现不错，LM Studio 就能跑，值得试试。

原文

6月29日

16:27

Pandaily@contact@pandaily.com (Pandaily)

精选73°

DeepSeek 与北京大学联合开发的 DSpark 推理系统获得 PyTorch 核心维护者 Dmytro Dzhulgakov 的详细技术分析。他重点称赞 DSpark 的半并行草稿（semi-parallel drafting）机制，能提升推理吞吐量。分析指出该系统达到生产级工程水平（production-grade engineering），在特定负载下相比基线有显著加速。这一评测为开源推理系统提供了高含金量的第三方验证。

AI模型 DeepSeek DSpark PyTorch 推理模型开源模型

推荐理由：PyTorch 核心大佬亲自下场拆解 DeepSeek 的 DSpark，说它半并行草稿很牛、工程落地扎实，搞推理优化的必看。

原文

00:16

量子位@听雨

Yuxinlu1在Hugging Face模型排行榜上击败多家大厂模型，登顶多个细分榜单。该账号发布的模型综合得分领先于Meta、Google等公司的开源项目。排行榜显示其推理效率与准确率均达到SOTA水平。

AI模型 yuxinlu1 Hugging Face 模型排行榜开源模型

推荐理由：一个个人开发者干翻大厂，看看yuxinlu1到底做了什么模型这么强

原文

6月28日

16:03

Decoder@Jonathan Kemper

精选

新浪微博发布开源模型VibeThinker-3B，仅30亿参数。在数学和编程基准上，它匹配了DeepSeek V3.2和Kimi K2.5，后两者参数规模大333倍。模型通过多阶段后训练实现高性能。研究人员假设：逻辑推理可压缩进小模型，但广泛世界知识不行。

AI模型 VibeThinker-3B 新浪推理模型开源模型

推荐理由：30亿参数的小模型推理能力居然能打千亿级大模型，新浪VibeThinker-3B在数学和编程上很强，而且开源了。

原文

14:34

量子位@林樾

百度在GitHub开源了全新OCR模型，模型名称暂未公开，但根据展示能一次性识别整本图书内容。该模型作者被社区推测为前DeepSeek研究员。项目已在GitHub托管，提供预训练权重和API文档。

AI模型百度 OCR 开源模型 DeepSeek

推荐理由：百度搞了个能扫整本书的OCR，还开源了，做文档处理的可以试试。

原文

13:01

marktechpost@Asif Razzaq

精选

Liquid AI 发布了 LFM2.5-230M，这是其最小的 230M 参数开源权重模型。该模型在 Galaxy S25 Ultra 上达到 213 tok/s，在 Raspberry Pi 5 上为 42 tok/s。基于 LFM2 架构，它专注于工具使用和数据提取，在指令遵循上击败了 Qwen3.5-0.8B 和 Gemma 3 1B 等更大模型。模型支持 llama.cpp、MLX、vLLM、SGLang 和 ONNX 框架。

AI模型 LFM2.5-230M Liquid AI 开源模型设备端推理推理框架

推荐理由：Liquid AI 出了个超小模型 LFM2.5-230M，手机跑 213 tokens 每秒，树莓派也能跑 42，指令遵循还比 Qwen3.5-0.8B 和 Gemma 3 1B 强。

原文

6月27日

19:36

Sebastian Raschka: Ahead of AI@Sebastian Raschka, PhD

精选

本文介绍如何用aider和Continue等本地编码代理工具替代Claude Code与GitHub Codex订阅。这些工具可搭配Ollama部署的Llama 3和DeepSeek Coder等开源模型。本地运行能保护代码隐私，并节省每月订阅费用。作者给出了从安装Ollama到连接模型的完整配置步骤。

技巧 Claude Code Codex aider 编程助手开源模型

推荐理由：想省掉Claude Code的月费？Sebastian手把手教你用本地开源模型加aider和Continue自己搭编码代理，便宜又安全。

原文

15:51

15:51IT之家（博客/媒体）

76°

6月27日，北大与DeepSeek联合开源DSpark推理加速框架，已部署于DeepSeek-V4-Flash与V4-Pro预览版引擎。该框架相比单token推测解码基线MTP-1，在同等吞吐量下将单用户生成速度提升60%至85%。DSpark采用半自回归架构，在Qwen3-4B模型上平均接受长度比Eagle3提升约30.9%，比DFlash提升约16.3%。V4-Flash引擎实测中，80 token/s SLA下聚合吞吐量提升51%，120 token/s下提升661%。相关论文、训练代码及模型检查点已在GitHub DeepSpec项目开源。

AI模型 DeepSeek DSpark 北京大学推理模型开源模型

推荐理由：北大和DeepSeek开源了DSpark，能让高并发下大模型生成速度提升最多85%。想提速可以试试。

原文

6月26日

13:00

量子位@鱼羊

英伟达开源了一款新的MoE加速库，只需一行import即可集成到Transformers v5中。微调速度提升3.7倍。该库支持专家并行技术，并整合了DeepEP和TransformerEngine组件。用户无需修改现有代码即可获取显著性能提升。

AI模型英伟达 MoE Transformers v5 DeepEP 开源模型

推荐理由：想让你HuggingFace上的MoE模型微调更快？英伟达这个新库一行代码就能加速3.7倍，直接用。

原文

10:10

pandaily@contact@pandaily.com (Pandaily)

智谱AI和MiniMax两家中国AI公司的市场估值出现分化，前者估值约200亿元人民币，后者约150亿元。这一走势与全球市场Anthropic（估值约615亿美元）和OpenAI（估值约3000亿美元）的差距扩大相呼应。双方均聚焦于多模态大模型和智能体应用，但融资速度和商业化路径不同。智谱AI以技术开源和B端合作为主，MiniMax则侧重C端产品与海外市场拓展。

行业智谱AI MiniMax 估值行业格局开源模型

推荐理由：聊中国AI格局必看这篇，智谱AI和MiniMax谁更像Anthropic和OpenAI，估值数据和背后逻辑都讲清楚了。

原文

6月25日

16:54

16:54IT之家（博客/媒体）

月之暗面B端负责人黄震昕在亚马逊云科技中国峰会上表示，Kimi的B端业务占比持续提升，海外业务快速增长，员工规模仅300多人且优先投入模型研发。用户对高性能Token有溢价支付意愿，但Kimi通过Cache命中率优化等技术降低成本，目前Cache命中率已超过90%。6月12日月之暗面开源了Kimi K2.7 Code编程模型，相比K2.6在长上下文编程指令遵循和长程编程任务性能上显著提升，平均token消耗减少30%。

AI模型 Kimi K2.7 Code 月之暗面编程助手开源模型

推荐理由：月之暗面想和OpenAI、Google、Anthropic掰手腕，B端业务起来了，还开源了编程模型K2.7 Code，token省30%。

原文

6月23日

19:03

19:03IT之家（博客/媒体）

网易有道发布Confucius4-TTS，这是业内首个支持14种语言跨语种无口音的开源TTS模型。用户仅需提供3秒音频素材，无需参考文本即可完成零样本语音克隆，克隆音色与原声相似度超85%，准确度达97%。模型采用GPT式语义大模型搭配Flow Matching流匹配生成框架，支持音频Prompt情感克隆迁移，可跨语种保留语调韵律。全量开源（Apache协议），提供54GB完整资源包，商用无限制，适用于多语种内容生成、数字人配音等场景。

AI模型 Confucius4-TTS 网易有道语音克隆开源模型 TTS

推荐理由：网易新开源Confucius4-TTS，3秒克隆你的声音，还能用这个声音说14种外语没口音，全开源随便用，做配音超方便。

原文

18:25

18:25IT之家（博客/媒体）

英国政府拨款6000万英镑（约5.39亿元人民币）为牛津大学和UCL建立两座AI实验室，重点开发低硬件需求的开源AI模型。项目将与美国闭源高算力方案形成对比，旨在减少对大型科技公司产品的依赖。两所大学还额外拨款200万英镑（约1795.8万元人民币）培养博士生，并至少招聘10名研究人员。AI事务部长Kanishka Narayan表示此举将让AI更便宜、更易部署，确保英国处于领先地位。

行业英国政府开源模型牛津大学 UCL AI实验室

推荐理由：英国砸6000万英镑搞开源AI实验室，专门做低算力模型，想摆脱对美国大厂的依赖，和闭源路线对着干。

原文

6月22日

23:24

23:24IT之家（博客/媒体）

SpaceX与开源AI初创公司Reflection AI签署算力合作协议，最高价值63亿美元（约427.71亿元人民币）。根据协议，Reflection将立即获得英伟达GB300 AI芯片使用权，用于训练和运行高级模型。Reflection同意从2026年7月1日至2029年底每月向SpaceX支付1.5亿美元（约10.18亿元人民币）。合约生效满三个月后，任意一方可提前90天终止。Reflection是开源AI企业，尚未发布前沿级模型，但参与美国能源部创世纪计划和五角大楼AI计划。

行业 SpaceX Reflection AI GB300 开源模型算力合作

推荐理由：SpaceX签了个63亿美元的大单，和开源AI公司Reflection合作，对方能用上英伟达GB300芯片，行业风向标啊。

原文

16:45

16:45IT之家（博客/媒体）

71°

京东发布并开源了实时视频视觉语言交互模型JoyAI-VL-Interaction，这是全球首个全栈开源的interaction模型和系统，获得vLLM-Omni的day-0原生支持。该模型能持续观察视频流，自主判断何时响应，而非被动等待用户提问。在58个真人盲评案例中，JoyAI-VL-Interaction对比豆包视频通话助手胜率77.6%，对比Gemini视频通话助手胜率87.9%。它支持摄像头、直播流、监控流等多种视频输入，并具备后台智能体委托能力。

AI模型 JoyAI-VL-Interaction 京东多模态智能体开源模型

推荐理由：京东开源了JoyAI-VL-Interaction，能实时看视频主动说话，安防、直播都能用，盲评胜率比豆包和Gemini高一大截。

原文

12:54

量子位@思邈

清华大学团队开源的空间智能模型被ECCV 2026接收。该模型在空间理解基准上得分超过Gemini。它能够处理120分钟的长视频并保持上下文。模型权重和代码已开源。

AI模型空间模型 ECCV2026 清华 Gemini 开源模型

推荐理由：清华这套空间模型在ECCV 2026上把Gemini比下去了，还能边看两小时长视频边记，玩空间理解的同学可以试试。

原文

10:43

pandaily@contact@pandaily.com (Pandaily)

微软因AI推理token成本飙升，宣布Copilot Cowork产品改为基于使用量的定价模式。为控制成本，微软选择整合开源模型DeepSeek V4作为替代方案。这一决策反映了大型企业在大规模AI部署中面临的经济压力，以及开源模型在成本效率上的竞争力。DeepSeek V4的参数量与性能表现接近GPT-4级别，但推理成本可降低80%以上。

AI产品微软 DeepSeek V4 定价策略开源模型 AI成本

推荐理由：微软的Copilot因为Token太贵改用DeepSeek了，以后按用量计费，用多少付多少。想省钱的话可以关注这个开源模型。

原文

6月21日

05:58

marktechpost@Michal Sutter

Nous Research为其开源智能体框架Hermes Agent新增了Blank Slate模式。该模式默认仅启用provider、model、File Operations和Terminal四项基础功能。用户通过platform_toolsets.cli和disabled_toolsets命令行接口手动添加其他工具集，实现从零开始配置。这种设计避免了预装过多工具，提升了Agent的灵活性和可控性。

AI模型 Hermes Agent Nous Research 智能体工具集开源模型

推荐理由：想精细控制Agent工具？Nous Research给Hermes Agent加了Blank Slate模式，从零选工具，不预装一堆，清爽又可控。

原文

6月20日

10:18

pandaily@contact@pandaily.com (Pandaily)

小米发布并开源了Miloco 2.0全屋AI系统，具备多模态感知能力，可识别用户行为和场景。该系统支持主动智能，能预测需求并执行持续任务，如自动调节灯光温度。Miloco 2.0拥有家庭记忆功能，可记住家庭成员的偏好和习惯。该系统被比作钢铁侠的JARVIS管家，面向中国家庭提供个性化服务。

AI模型小米 Miloco 2.0 智能家居多模态开源模型

推荐理由：小米开源了Miloco 2.0，一个像JARVIS一样有记忆能主动帮忙的智能家居AI，多模态和家庭记忆功能很实用。

原文

6月19日

14:30

14:30Latent Space (swyx)（博客/媒体）

GLM-5.2在主观体验测试中表现优异，得到社区好评。Z.ai 预测开源项目 Open Fable 将于12月推出。这标志着开源模型在性能上逐步接近前沿水平。

AI模型 GLM-5.2 Z.ai Open Fable 开源模型

推荐理由：GLM-5.2这次主观评价不错，开源模型终于开始追上GPT了。Z.ai预测年底会有新开源项目，值得关注。

原文

11:27

11:27IT之家（博客/媒体）

阿里巴巴集团主席蔡崇信在VivaTech 2026上表示，AI总潜在市场规模对标人类生产力，全球GDP超100万亿美元中至少50万亿美元来自人类生产力，这是阿里的目标。阿里全面投入AI，全栈覆盖能源、基础设施、模型和应用层，拥有开源模型千问（Qwen）。蔡崇信指出当前全球AI开源主要推动力量来自中国企业，阿里团队持续贡献前沿模型开源。

行业阿里巴巴 Qwen 开源模型全栈AI

推荐理由：阿里主席亲口说了：AI市场对标50万亿美元，全栈押注，千问开源是全球主力。想看清阿里AI战略的必看。

原文

6月18日

12:35

12:35IT之家（博客/媒体）

73°

阿里与人大联合开源 LOGOS，这是一个基于统一“科学语法”的多领域科学生成基础模型。LOGOS-1B 仅用 1B 参数量，在多项科学任务上超越参数为 8×7B 的微软 NatureLM。模型预训练语料涵盖蛋白质（28.9B tokens）、抗体（3.0B tokens）、小分子（2.1B tokens）等 7 类模态共 44.87B tokens。它通过共享词表将异构对象编码为离散 token，无需 3D 坐标即可理解 3D 空间互作规律。LOGOS 已开源模型权重、推理代码与技术报告。

AI模型 LOGOS NatureLM 开源模型科学大模型多模态

推荐理由：阿里开源的 LOGOS 模型，用 1/56 参数就碾压了微软 NatureLM，还统一了蛋白质、小分子等科学对象的语言，搞科研的可以看看源码和论文，开箱即用。

原文

11:09

11:09IT之家（博客/媒体）

72°

华为昇腾宣布0 Day支持智谱GLM-5.2，昇腾A3系列已实现单双机及大EP推理部署。优化技术包括MOE大融合算子、通信与计算融合、注意力前处理与多Token预测、高并发调度与预填充延迟机制等。GLM-5.2在Code Arena盲测中取得全球可用模型第一，拥有1M上下文能力，长程任务表现介于Claude Opus 4.7与4.8之间。该模型在主流编程基准上保持开源SOTA，并已适配华为昇腾等国产算力平台。

AI模型 GLM-5.2 华为昇腾推理优化开源模型代码生成

推荐理由：华为昇腾0 Day适配智谱GLM-5.2，推理优化让长上下文编程更高效，开源模型性能比肩Claude Opus。

原文

08:15

08:15Simon Willison’s Weblog（博客/媒体）

精选73°

中国AI实验室Z.ai于6月16日开源GLM-5.2，采用MIT许可证。该模型753B参数、40激活参数（MoE），上下文窗口从GLM-5.1的20万提升至100万。在Artificial Analysis Intelligence Index v4.1上以51分领先MiniMax-M3（44）和DeepSeek V4 Pro（44）。在Code Arena WebDev前端编码排行榜上排名第二，仅次于Claude Fable 5。OpenRouter上输入价格$1.40/百万token，输出$4.40/百万token。

AI模型 GLM-5.2 Z.ai OpenRouter 开源模型编程助手

推荐理由：Z.ai开源了GLM-5.2，纯文本模型在智能和编码基准上超过DeepSeek V4和Kimi K2.6，价格只有GPT-5.5的五分之一。

原文

01:55

Decoder@Jonathan Kemper

精选

智谱AI推出开源模型GLM-5.2，采用MIT许可证，支持稳定100万token上下文。在FrontierSWE编码基准测试中，GLM-5.2以1个百分点之差落后于Anthropic的Claude Opus 4.8。该模型在推理能力上仍显著落后于闭源竞争对手。

AI模型 GLM-5.2 智谱AI Claude Opus 开源模型编码助手

推荐理由：智谱AI的GLM-5.2在长时间编码任务上只比Claude Opus 4.8差1%，还是开源免费，码农可以试试。

原文

01:30

marktechpost@Asif Razzaq

Vercel 开源了 Eve，这是一个 Apache-2.0 许可的 AI Agent 框架，目前处于公开预览阶段。每个 Agent 被定义为一个包含配置和能力的文件目录，内置了持久化执行、沙箱、审批、连接、通道和评估功能。开发者可使用 npx eve@latest init 快速搭建项目，并通过 vercel deploy 直接部署无需修改。

AI模型 Eve Vercel 智能体开源模型编程助手

推荐理由：Vercel 出了个开源 Agent 框架 Eve，把 Agent 做成文件目录，自带沙箱和评估，用 npx init 就能部署，挺省事的。

原文

00:35

量子位@henry

71°

一家头部具身大脑公司完成数亿美元新一轮融资，投资方共15家VC。该公司坚持世界模型技术路线，半年内先后在开源、端侧和训练场三个方向发布方案。具体开源项目名称和端侧部署参数尚未披露。训练场支持与多种机器人硬件适配。该轮融资将用于扩大研发团队和加速产品落地。

行业具身智能融资世界模型开源模型端侧部署

推荐理由：一家专注具身大脑的公司又融了一大笔钱，世界模型路线，15家VC跟进。开源、端侧、训练场三连发，你可以关注它的技术方案。

原文

6月17日

11:40

11:40IT之家（博客/媒体）

大晓机器人联合香港中文大学发布并开源具身操作VLA模型ACE-Ego。在RoboCasa GR1 TableTop基准上，ACE-Ego以72.8%平均成功率刷新纪录，超越英伟达GR00T、PI π₀.₅等模型。在RoboTwin 2.0高难度双臂操作测试中，ACE-Ego成功率90.62%。该模型已能稳定完成塑料袋打包、鞋子装入鞋盒等零售操作。

AI模型 ACE-Ego 大晓机器人人形机器人具身智能开源模型

推荐理由：大晓机器人开源了新模型ACE-Ego，在人形机器人操作基准上拿了第一，能打包塑料袋、装鞋盒，挺实用的。

原文

11:36

量子位@十三

智谱AI于2026年6月开源了GLM-5.2模型，支持1M上下文长度。该模型在AI编程评测基准上取得第一，超过此前领先的Fable-5。基于GLM架构的持续优化，GLM-5.2在代码生成任务中展现出更强能力。开源版本已发布在GitHub。

AI模型 GLM-5.2 智谱编程助手开源模型长上下文

推荐理由：智谱开源了GLM-5.2，1M超长上下文，编程能力直接拿下第一，想换编程模型的话可以试试。

原文

09:27

09:27IT之家（博客/媒体）

精选

智谱发布并开源 GLM-5.2 模型，支持 1M 无损上下文。在 Code Arena 盲测中取得全球可用模型第一。在多个长程任务基准上表现介于 Claude Opus 4.7 与 4.8 之间。编程基准上保持开源 SOTA，与 Claude Opus 4.8 可比。已适配华为昇腾、平头哥等国产算力平台，单位 token FLOPs 降至 2.9 倍。

AI模型 GLM-5.2 智谱 Code Arena 开源模型上下文长度

推荐理由：智谱的 GLM-5.2 开源了，1M 上下文还拿了 Code Arena 第一，编程和长任务都强，国产算力也能跑。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

14:55

量子位@量子位的朋友们

阿里发布Qwen-Robot系列，包含Qwen-Robot-V1、Qwen-Robot-V1-Pro和Qwen-Robot-V1-Plus三款模型。该系列将视觉、语言与行动能力整合，支持在复杂环境中完成抓取、导航等任务。在RoboBench基准上，Qwen-Robot-V1-Pro任务成功率较基线提升15.3%。模型参数规模从7B到72B不等，可适配不同硬件平台。

AI模型 Qwen-Robot 阿里具身大模型机器人开源模型

推荐理由：阿里刚出的Qwen-Robot系列，三个模型从7B到72B，让机器人能边看边想边动，RoboBench成绩提升15%，搞具身智能的值得看看。

原文

09:37

AWS Machine Learning Blog@Aris Tsakpinis

精选

Google DeepMind 发布的 Gemma 4 开源权重模型系列现已在 Amazon Bedrock 上可用。该系列包含三个指令调优变体：Gemma 4 31B（密集架构）、26B-A4B（MoE 架构，每次激活 4B 参数）和 E2B。所有变体均支持内置推理、原生函数调用以及文本和图像多模态输入。模型基于 Apache 2.0 许可发布，旨在多种部署场景下实现每参数智能最大化。

AI模型 Gemma 4 Amazon Bedrock Google DeepMind 开源模型多模态

推荐理由：Google DeepMind 把最新的 Gemma 4 放到 AWS 上了，三种规格可选，带推理和图文理解，正好拿来玩开源项目。

原文

6月15日

23:15

23:15IT之家（博客/媒体）

78°

稀宇科技于6月12日开源了 MiniMax M3 模型权重，总参数428B，激活参数23B。M3 是首个从 Step 0 开始进行多模态混合训练的开源模型，支持百万上下文。发布两周后，M3 在 Artificial Analysis 综合智能指数排行榜上获得全球开源模型最高排名。模型输出速度已从30 TPS提升至约80 TPS，后续还将提速30-40%。在编码与智能体评测中达到行业顶尖水平，具备自主任务拆解、工具调用与多步推理能力。

AI模型 MiniMax M3 多模态开源模型百万上下文智能体

推荐理由：MiniMax 开源了原生多模态巨无霸 M3，428B参数、百万上下文，全球开源排名第一，还能自主拆任务调工具，速度从30飙到80 TPS。

原文

23:01

23:01IT之家（博客/媒体）

巴西IplanRIO发布的Rio-3.5-Open-397B模型在多个基准测试取得SOTA，被奉为拉美开源新势力。上海创智学院Nex团队指控该模型套壳阿里千问Qwen3.5和Nex N2 Pro的权重，并展示证据：无系统提示时模型自称“Nex N2 Pro”且提及“上海创智学院”。IplanRIO在Hugging Face致歉，称因操作失误上传了合并基线版本，承诺后续重新上传正式版。

行业 Rio-3.5-Open-397B Qwen3.5 Nex N2 Pro 开源模型模型套壳

推荐理由：巴西公司号称自研的黑马模型，结果是个套壳缝合怪，被扒得底裤都不剩。看看证据有多实锤。

原文

16:13

量子位@思邈

Noiz AI联合香港科技大学和清华大学开源了一款音频生成大模型。该模型仅需4步推理即可生成高质量音频，在单张GPU上推理速度达到0.24秒。其高效架构显著降低了音频生成的计算门槛。开源代码和模型权重已在GitHub发布，支持多种音频生成任务。

AI模型音频生成开源模型 Noiz AI 快速推理

推荐理由：噪点AI和港科大、清华联手做了一个音频模型，4步生成只要0.24秒，比同类快很多，还开源了，想玩音频AI的可以试试。

原文

14:13

marktechpost@Michal Sutter

79°

Z.ai 于 2026 年 6 月 13 日发布 GLM-5.2，覆盖所有 GLM Coding Plan 层级。该模型支持 100 万 token 的可用上下文窗口，并提供 High 和 Max 两种思考努力级别。GLM-5.2 通过 Anthropic 兼容端点集成到 Claude Code、Cline 和 OpenClaw 等工具中。发布时未公布基准测试结果，MIT 开源权重预计下周发布。

AI模型 Z.ai GLM-5.2 长上下文推理模型开源模型

推荐理由：Z.ai 的 GLM-5.2 支持百万token上下文，还能选思考深度

原文

6月14日

16:18

Pandaily@contact@pandaily.com (Pandaily)

72°

智谱AI宣布将GLM-5.2模型以MIT许可证开源，支持100万token上下文长度。此举直接回应美国针对Anthropic模型的出口限制。GLM-5.2在多项基准测试中表现优异，其开源策略旨在推动国内AI生态发展。

AI模型 GLM-5.2 Zhipu AI 开源模型长上下文 MIT许可证

推荐理由：智谱开源百万token模型

原文

6月13日

23:22

23:22IT之家（博客/媒体）

智谱发布 AI 编程工具 ZCode 3.0，全面切换自研 ZCode Agent 内核，深度适配 GLM-5.2 模型。GLM-5.2 支持 1M 上下文，是智谱迄今能力最强的开源模型。ZCode 3.0 新增分组式任务工作区、Zread 智能项目知识库、可视化 Git 分支图谱等功能。官方表示整体任务完成效果已显著优于第三方 Agent。

AI产品 ZCode GLM-5.2 智谱编程助手开源模型

推荐理由：智谱自研内核，编程体验升级

原文

22:51

量子位@鹭羽

HuggingFace CEO和Bengio团队推荐的HRM模型，参数量仅1B，训练成本仅1500美元。该模型在多个基准测试中表现优于同规模模型，如MMLU上达到45.2%，HellaSwag上达到72.1%。其核心创新在于高效训练方法，大幅降低了资源需求。

AI模型 HRM HuggingFace Bengio 开源模型推理模型

推荐理由：1B模型，1500美元，性能超预期

原文

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？