全部 AI 动态 · AI 热点

6月21日

03:54

Suhail@Suhail

精选

Z.ai推出GLM-5.2开源模型，采用MIT开放权重。该模型支持1M上下文窗口，在Terminal-Bench 2.1基准上得分81.0，仅比Claude Opus 4.8低几分。Perplexity CEO此前指出，中国已拥有最强开源模型DeepSeek，且美国开发者正基于其构建应用。GLM-5.2的发布进一步表明开源AI竞赛已非理论。

AI模型 GLM-5.2 Z.ai DeepSeek 开源模型推理模型

推荐理由：Z.ai刚刚放出了GLM-5.2，MIT开源、100万上下文、跑分81.0，跟Claude Opus 4.8差距很小，做开源模型的得看看。

原文

00:53

elvis@omarsar0

精选

GLM-5.2 在图形设计能力上据称达到 Opus 级别，同时在长期运行任务中表现良好。其训练引入了反奖励破解模块，用于解决强化学习中常见的奖励破解问题，例如模型走捷径、变懒、意图偏差等。该模块有助于提升编码代理在长周期任务中的可靠性与效果。GLM-5.2 是一个开源开放权重模型。

AI模型 GLM-5.2 奖励破解开源模型设计长期任务

推荐理由：GLM-5.2 据称设计和长任务都接近 Opus，关键是加了个反奖励破解机制，让模型更靠谱。

原文

6月20日

10:54

shao__meng@shao__meng

GLM 5.2 开源后在 X 平台获得多位国外 AI 博主称赞。智谱港股股价近期飙升，市值已超过 MiniMax 并接近小米。作者提到智谱内部运营问题和自身充值体验，但认为模型够强仍是核心。

AI模型 GLM 5.2 智谱开源模型港股

推荐理由：智谱开源了 GLM 5.2，国外博主都在夸，股价还涨到快赶上小米了，模型实力真的能打。

原文

10:18

pandaily@contact@pandaily.com (Pandaily)

小米发布并开源了Miloco 2.0全屋AI系统，具备多模态感知能力，可识别用户行为和场景。该系统支持主动智能，能预测需求并执行持续任务，如自动调节灯光温度。Miloco 2.0拥有家庭记忆功能，可记住家庭成员的偏好和习惯。该系统被比作钢铁侠的JARVIS管家，面向中国家庭提供个性化服务。

AI模型小米 Miloco 2.0 智能家居多模态开源模型

推荐理由：小米开源了Miloco 2.0，一个像JARVIS一样有记忆能主动帮忙的智能家居AI，多模态和家庭记忆功能很实用。

原文

03:36

Andrew Ng@AndrewYNg

精选73°

Anthropic发布了其Mythos模型的变体Claude Fable 5，并施加了包括禁止用于构建竞争LLM技术在内的额外限制。Anthropic还曾暗中降低Fable 5对LLM研究者的性能，在争议后改为透明执行，但仍拒绝用最新能力帮助AI研究者。随后美国政府利用商务部权力对Mythos和Fable实施出口管制，要求任何外国国民使用需许可证，导致Anthropic全球禁用Fable。Andrew Ng评论称Anthropic利用安全论调阻碍竞争者，而恐惧营销反而促使政府加强管制。

行业 Anthropic Claude Fable 5 出口管制 AI安全开源模型

推荐理由：Anthropic一边用Claude Fable 5的“安全”理由限制开发者，一边被美国政府反手出口管制，Andrew Ng分析这暴露了封闭平台的不可靠性。

原文

02:37

Allen AI (Ai2)@allen_ai

AI Squared 和 Domyn 两家公司利用 Allen AI 完全开源的 Olmo 语言模型系列，在金融、医疗和公共部门等受监管行业构建自定义模型。Olmo 模型提供完整开放性，允许企业根据行业法规进行合规微调和使用。该案例展示了开源模型在敏感领域实现私有化部署的具体路径。

技巧 Olmo AI Squared Domyn Allen AI 开源模型

推荐理由：金融医疗这种严监管行业，看看两家公司怎么直接拿开源模型Olmo改造成自己的，挺有参考价值。

原文

01:34

@atomic_chat_hq@atomic_chat_hq

KiloCode是一款被300万以上开发者使用的代码助手，现在可通过Atomic Chat在开源模型上本地运行。所有操作均在设备端完成，无需云端依赖，保证完全隐私。该服务免费且开源，支持代码编写、调试和构建。

AI产品 KiloCode Atomic Chat 开源模型编程助手本地AI

推荐理由：KiloCode现在能直接用本地开源模型跑了，完全免费还保护隐私，3M+开发者都在用。

原文

6月19日

23:57

Thomas Wolf@Thom_Wolf

开源模型生态欢迎新手尝试Opus 4.8级别的模型。GLM-5.2是ZAI org发布的开放权重模型，可通过Hugging Face页面使用。多个供应商竞争价格，智能体价格便宜。模型可本地运行、微调并构建商业应用，无需许可。HuggingChat提供免费聊天界面。

AI模型 GLM-5.2 Hugging Face 开源模型本地部署微调

推荐理由：GLM-5.2达到Opus 4.8水平，免费、可本地跑、可微调，比闭源灵活还便宜，快试试！

原文

18:40

Together AI@togethercompute

TogetherAI用Kimi K2.7 Code和Claude Fable 5各生成12个落地页。Kimi的成本仅为Claude的1/16，质量表现接近。通过设计MCP服务器提供视觉上下文后，Kimi效果更佳。这表明开源模型在落地页生成工作流中已是高性价比的实用选择。

AI模型 Kimi K2.7 Code Claude Fable 5 开源模型 MCP/工具代码模型

推荐理由：想低预算做落地页？试试Kimi K2.7 Code，便宜16倍效果不输Claude Fable 5，尤其配合MCP服务器更稳。

原文

18:39

Together AI@togethercompute

Together Compute 测试了闭源和开源模型构建小型可玩游戏的能力。结果显示，开源模型成本更低、速度更快，生成游戏质量接近闭源模型。例如，Opus 4.8 成本是 MiniMax M3 的 15 倍，GPT-5.5 是 Nemotron Ultra 的 10 倍，而 Kimi K2.7 Code 比 Opus 4.8 便宜 7 倍。

AI模型 Opus 4.8 MiniMax M3 GPT-5.5 开源模型游戏生成

推荐理由：Together Compute 实测：闭源模型贵几倍，开源做小游戏又快又便宜，质量还接近，想省钱就选开源。

原文

18:38

Together AI@togethercompute

DecagonAI 通过与 Together AI 合作，将语音代理每轮对话成本降低近6倍，同时保持实时语音所需的低延迟。他们从闭源模型迁移到微调的开源模型，实现 p95 模型延迟低于400ms。采用自定义投机解码和提示缓存技术，并在 NVIDIA Blackwell 上优化服务部署。模型更新频率达到每周甚至每日，体现了从封闭 API 到开放模型的转变。

行业 DecagonAI Together AI NVIDIA Blackwell 语音代理开源模型

推荐理由：DecagonAI 把语音成本砍到原来的1/6，延迟还压到400ms以下，实时语音项目可以参考他们迁移开源模型的做法。

原文

16:39

歸藏(guizang.ai)@op7418

唐老师与马斯克在推特上讨论国内开源版本何时能达到Fable 5级别模型的标准。马斯克回应称“不会那么久”，暗示可能早于2027年。该对话引发对国内开源模型进展加速的预期。目前尚无具体时间表或模型细节。

行业 Fable 5 马斯克开源模型国内AI进展

推荐理由：马斯克说国内开源Fable 5级别模型不用等到2027年，唐老师跟进爆料，这波节奏值得盯一下。

原文

14:30

14:30Latent Space (swyx)（博客/媒体）

GLM-5.2在主观体验测试中表现优异，得到社区好评。Z.ai 预测开源项目 Open Fable 将于12月推出。这标志着开源模型在性能上逐步接近前沿水平。

AI模型 GLM-5.2 Z.ai Open Fable 开源模型

推荐理由：GLM-5.2这次主观评价不错，开源模型终于开始追上GPT了。Z.ai预测年底会有新开源项目，值得关注。

原文

12:51

Cohere@cohere

精选

Cohere宣布其首个开源智能体编码模型的4-bit量化版本已可用。该量化版模型体积显著缩小，可在Mac上本地运行。用户可通过链接获取模型权重。此次发布使得开发者能够更便捷地在个人设备上运行智能体编码模型。

AI模型 Cohere 4-bit量化智能体编码模型开源模型

推荐理由：Cohere把自己最新的编程智能体模型压缩到4-bit，Mac上就能跑，本地开发效率直接拉满！

原文

12:42

Fireworks AI@FireworksAI_HQ

Jeremy Howard在X平台上称赞Zai_org的GLM 5.2模型，称其至少与Opus 4.8和GPT 5.5一样优秀。他指出该模型速度极快、成本低廉且回答不冗长，在处理长上下文时表现非常出色。Howard表示从未见过如此优秀的开源权重模型。

AI模型 GLM 5.2 Zai_org Opus 4.8 GPT 5.5 开源模型

推荐理由：想试试媲美顶级闭源模型的开源模型吗？GLM 5.2又快又便宜，长上下文超强，看看Jeremy Howard怎么夸的。

原文

11:27

11:27IT之家（博客/媒体）

阿里巴巴集团主席蔡崇信在VivaTech 2026上表示，AI总潜在市场规模对标人类生产力，全球GDP超100万亿美元中至少50万亿美元来自人类生产力，这是阿里的目标。阿里全面投入AI，全栈覆盖能源、基础设施、模型和应用层，拥有开源模型千问（Qwen）。蔡崇信指出当前全球AI开源主要推动力量来自中国企业，阿里团队持续贡献前沿模型开源。

行业阿里巴巴 Qwen 开源模型全栈AI

推荐理由：阿里主席亲口说了：AI市场对标50万亿美元，全栈押注，千问开源是全球主力。想看清阿里AI战略的必看。

原文

11:04

arXiv cs.LG@Haw-Shiuan Chang, Jeffrey Gomez, Mehul Patwari, Aryan Sajith, Hamed Zamani

这篇论文提出利用用户与LLM交互时的鼠标轨迹和眼动数据作为隐式反馈来替代昂贵的显式偏好标注。他们构建了IFLLM数据集，包含59名用户的1336个多轮问答，并记录了鼠标和眼动数据。基于这些隐式反馈训练的奖励模型将文本奖励模型的准确率从55%提升到64%。对8个LLM应用DPO后，响应质量相对提升近3倍，证明了隐式反馈在真实场景中的价值。数据集和代码已开源。

论文 IFLLM LLM 隐式反馈 DPO 开源模型

推荐理由：别光看用户点了什么赞，鼠标和眼睛动的方向才是真心话。这篇论文用59人的眼动和鼠标轨迹数据训练奖励模型，准确率从55%飙到64，还开源了数据集。

原文

06:25

Clement Delangue@ClementDelangue

Hugging Face CEO Clement Delangue认为，事后API护栏无法消除模型的危险能力，只能隐藏在脆弱的接口后面，容易被越狱（jailbroken）。他建议不要训练高风险能力，除非有强评估、理由和遏制措施；采用分阶段发布（staged release），从可信测试者到更广泛访问，并开放发布以透明和问责。他呼吁大力支持开源AI，缩小封闭实验室和政府之间的能力差距；推动独立评估，而非信任黑盒API；赋予执法、法院、监管者、审计员、记者和公民社会强大的AI工具来检测和追究非法使用。

行业 AI安全开源模型独立评估分阶段发布 API护栏

推荐理由：Hugging Face CEO提出一个务实的AI安全路线：别只靠事后护栏，要加强独立评估、分阶段发布和开源生态。

原文

04:25

Clement Delangue@ClementDelangue

精选

AI模型 Poolside Laguna M.1 Hugging Face 开源模型长上下文

推荐理由：Poolside 把最强的 Laguna M.1 模型完全开放了，256K 上下文，Apache 2.0 许可，直接去 Hugging Face 下载权重用。

原文

03:09

Sebastian Raschka@rasbt

73°

AI模型 GLM-5.2 DeepSeek V3.2 IndexShare 推理模型开源模型

推荐理由：智谱的GLM-5.2开放权重模型，用DeepSeek V3.2的注意力机制加上自己的IndexShare，把1M长上下文推理搞便宜了，值得看看。

原文

03:04

vLLM@vllm_project

精选

Poolside 发布开源智能体编程模型 Laguna M.1，采用 70 层稀疏 MoE 架构，总参数量 225B，每 token 激活 23B，支持 256K 上下文。模型使用 256 个专家，top-k=16 路由，专为长程智能体编程设计。支持工具调用间交错推理，可每请求切换，采用 Apache 2.0 许可。vLLM v0.21.0 已提供 Day-0 支持。

AI模型 Laguna M.1 Poolside 开源模型编程助手智能体

推荐理由：Poolside 刚开源了 Laguna M.1，225B 参数的智能体编程模型，256K 上下文，vLLM 已原生支持，想玩 agentic coding 的可以试试。

原文

01:33

SiliconFlowAI@siliconflowai

精选

Z.ai 的 GLM 5.2 在编码基准 CodeArena 上排名第一。每百万 token 输入缓存/输入/输出价格为 0.26/1.40/4.40 美元，支持 1M 上下文长度。其编码性能与 Opus 4.8 相当，并提供 max 和 high 两种推理模式。该模型已完全开源，可通过 SiliconFlow 的 T+0 合作获取。

AI模型 GLM 5.2 Z.ai CodeArena SiliconFlow 开源模型

推荐理由：Z.ai 的 GLM 5.2 在编码竞技场拿了第一，价格比 Opus 便宜，还有 1M 上下文，编程党可以白嫖开源版。

原文

00:16

宝玉@dotey

一条推文表达对Mythos级别开源模型的期待，该推文获得1次转发和9次点赞。目前尚无具体发布信息或基准成绩。

行业 Mythos 开源模型

推荐理由：网友在推特上表达对Mythos开源模型的期待，已有1转发9点赞

原文

00:02

Geek@geekbb

精选

Unsloth AI 将最强开源模型 GLM-5.2 从 1.51TB 压缩至 238GB（缩小 84%），2-bit 量化版本保留约 82% 准确率。该模型可在 256GB Mac 或同等 RAM/VRAM 配置上本地运行。官方指南和 GGUF 文件已在 Hugging Face 发布。

AI模型 GLM-5.2 Unsloth 本地运行模型压缩开源模型

推荐理由：Unsloth 把 1.5TB 的 GLM-5.2 压到 238GB，本地就能跑，准确率还能保住 82%。有 256GB 内存的 Mac 就能玩，开源模型天花板。

原文

6月18日

20:22

vLLM@vllm_project

精选

vLLM 推出新功能，允许用户在自己的 GPU 上运行开源模型作为编程助手。该引擎兼容 OpenAI Responses API，因此任何使用代码助手的工具都可直接指向你的服务器。支持 NVIDIA、AMD 等多种硬件。当前可部署 GLM 5.2、Kimi K2.7 Code、MiniMax M3 等模型。

AI产品 vLLM 编程助手开源模型 GLM 5.2 Kimi K2.7 Code

推荐理由：vLLM 现在能让你自己在 GPU 上跑开源模型当编程助手，省了 API 钱还更灵活，支持 NVIDIA、AMD 和多种模型。

原文

15:10

LMSYS Org (SGLang)@lmsysorg

精选71°

SGLang-Omni 现已支持 MOSS-TTS-Local Transformer v1.5 模型。该模型基于 Qwen3-4B 骨干，可生成 48kHz 立体声语音。支持零样本语音克隆和原生流式，覆盖 31 种语言，训练数据约 400 万小时。非流式场景下达到 5.976 req/s，RTF 0.644，WER 1.75%（SeedTTS English，2×GPU）。采用三阶段管线：参考编码、AR 引擎、流式声码器。

AI模型 MOSS-TTS SGLang-Omni Qwen3-4B 语音克隆开源模型

推荐理由：SGLang-Omni 刚上线 MOSS-TTS v1.5，开源、零样本克隆声音，支持31种语言，速度也不错，玩玩看。

原文

15:03

小互@imxiaohu

Apodex 1.0 模型已正式发布，官方介绍页面提供了技术细节。在线体验平台 apodex.ai 可供用户直接试用。模型权重已在 Hugging Face 上开源下载。

AI模型 Apodex 开源模型 Hugging Face

推荐理由：Apodex 发布了 1.0 版本，有在线体验和开源下载，感兴趣可以试试。

原文

13:03

@atomic_chat_hq@atomic_chat_hq

Atomic Chat 正式在 Hugging Face 上线，成为该平台上的 Local App。用户可以直接在本地设备运行 Hugging Face 上的 200,000+ 个开放权重模型，所有处理都在设备端完成，保障隐私。该应用完全开源，无需联网即可使用多种模型。

AI产品 Atomic Chat Hugging Face 本地模型开源模型

推荐理由：Atomic Chat 现在能在本地跑 Hugging Face 上 20 多万个模型，完全离线私密，还开源，搞 AI 的可以试试看。

原文

12:35

12:35IT之家（博客/媒体）

73°

阿里与人大联合开源 LOGOS，这是一个基于统一“科学语法”的多领域科学生成基础模型。LOGOS-1B 仅用 1B 参数量，在多项科学任务上超越参数为 8×7B 的微软 NatureLM。模型预训练语料涵盖蛋白质（28.9B tokens）、抗体（3.0B tokens）、小分子（2.1B tokens）等 7 类模态共 44.87B tokens。它通过共享词表将异构对象编码为离散 token，无需 3D 坐标即可理解 3D 空间互作规律。LOGOS 已开源模型权重、推理代码与技术报告。

AI模型 LOGOS NatureLM 开源模型科学大模型多模态

推荐理由：阿里开源的 LOGOS 模型，用 1/56 参数就碾压了微软 NatureLM，还统一了蛋白质、小分子等科学对象的语言，搞科研的可以看看源码和论文，开箱即用。

原文

11:09

11:09IT之家（博客/媒体）

72°

华为昇腾宣布0 Day支持智谱GLM-5.2，昇腾A3系列已实现单双机及大EP推理部署。优化技术包括MOE大融合算子、通信与计算融合、注意力前处理与多Token预测、高并发调度与预填充延迟机制等。GLM-5.2在Code Arena盲测中取得全球可用模型第一，拥有1M上下文能力，长程任务表现介于Claude Opus 4.7与4.8之间。该模型在主流编程基准上保持开源SOTA，并已适配华为昇腾等国产算力平台。

AI模型 GLM-5.2 华为昇腾推理优化开源模型代码生成

推荐理由：华为昇腾0 Day适配智谱GLM-5.2，推理优化让长上下文编程更高效，开源模型性能比肩Claude Opus。

原文

10:57

Viking@vikingmute

GLM5.2在Artificial Analysis开源模型排名中登顶，多项benchmark评分领先。有用户反馈其实际体验接近Opus 4.6，作者考虑将Deepseek V4 Pro替换为GLM5.2。该帖子获得2条回复、505次浏览。

AI模型 GLM5.2 Artificial Analysis Opus 4.6 Deepseek V4 Pro 开源模型

推荐理由：GLM5.2在开源模型排名拿了第一，而且有人说用起来感觉像Opus 4.6，你要是想换掉Deepseek V4 Pro可以试试。

原文

08:15

08:15Simon Willison’s Weblog（博客/媒体）

精选73°

中国AI实验室Z.ai于6月16日开源GLM-5.2，采用MIT许可证。该模型753B参数、40激活参数（MoE），上下文窗口从GLM-5.1的20万提升至100万。在Artificial Analysis Intelligence Index v4.1上以51分领先MiniMax-M3（44）和DeepSeek V4 Pro（44）。在Code Arena WebDev前端编码排行榜上排名第二，仅次于Claude Fable 5。OpenRouter上输入价格$1.40/百万token，输出$4.40/百万token。

AI模型 GLM-5.2 Z.ai OpenRouter 开源模型编程助手

推荐理由：Z.ai开源了GLM-5.2，纯文本模型在智能和编码基准上超过DeepSeek V4和Kimi K2.6，价格只有GPT-5.5的五分之一。

原文

05:29

ollama@ollama

用户称 GLM 5.2 达到 SOTA 级别的智能，但成本仅为同类模型的一小部分。他认为 GLM 5.2 的输出和个性优于 GPT 5.5。他计划将 GLM 5.2 用于自己的工具 Hermes 以及客户项目中。该推文获得 170 点赞和超 7300 次浏览。

AI模型 GLM 5.2 GPT 5.5 Hermes 开源模型

推荐理由：有人实测后说 GLM 5.2 比 GPT 5.5 更强还便宜，准备放进自己产品用，有参考价值。

原文

04:56

elvis@omarsar0

GLM-5.2 在 Design Arena 设计基准上以 Elo 1360 分排名第一，超越此前第一的 Claude Fable 5。该模型擅长生成游戏、落地页、HTML 组件和 3D 世界等内容。Zai 组织发布了这个开源权重模型，其设计质量被认为接近 Opus 级别。评测显示它相比此前版本提升了 4 个名次和 27 个 Elo 点。

AI模型 GLM-5.2 Zai Design Arena 设计生成开源模型

推荐理由：Zai 开源的 GLM-5.2 在 Design Arena 上干掉了 Claude Fable 5，能设计游戏、HTML 和 3D 世界，不看后悔。

原文

04:01

lmarena.ai@lmarena_ai

AI模型 Agent Arena 智能体开源模型实验室

推荐理由：想对比开源智能体的表现？Agent Arena新排行榜支持按模型或实验室筛选，一目了然。

原文

03:55

LangChain@LangChainAI

LangChain测试显示，Alibaba Qwen基础模型配合良好提示在感知错误分类任务上性能接近前沿模型。使用LoRA SFT微调后，模型性能接近或超过前沿模型。实验表明微调能使开源模型与顶级闭源模型竞争。

AI模型 Qwen Alibaba LoRA 微调开源模型

推荐理由：LangChain实测：Qwen基础版+好提示就能追平顶级模型，微调后甚至超越。开源模型潜力很大！

原文

03:33

lmarena.ai@lmarena_ai

精选

Kimi K2.7 Code 在 Agent Arena 排行榜上总体排名第19，在开源模型中排第6。该模型在 Kimi Code Bench v2 上比 K2.6 提升21.8%，在 Program Bench 上提升11.0%，在 MLS Bench Lite 上提升31.5%。推理 token 使用量降低30%，减少了过度思考。长程编码任务指令遵循和完成率均有提升。目前通过 Kimi API 和 Kimi Code 可用。

AI模型 Kimi-K2.7-Code Kimi_Moonshot 开源模型编程助手推理模型

推荐理由：Kimi 发了新编程模型 K2.7 Code，推理更省 token，基准提升明显，而且在 Agent Arena 上开源模型里排第6，值得一试。

原文

03:30

ollama@ollama

精选

Ollama 宣布用户可以在 Codex App、CLI 和 SDK 中使用 GLM-5.2 和 Kimi-K2.7-Code 模型。此前 Codex 仅支持 OpenAI 模型，现在扩展至开源模型。使用命令 ollama launch codex 即可启用。这一集成让开发者能用更多模型进行代码生成。

AI产品 Ollama Codex GLM-5.2 Kimi-K2.7-Code 开源模型

推荐理由：Ollama 把 GLM-5.2 和 Kimi-K2.7-Code 也带进 Codex 了，以前只能用 OpenAI 模型，现在敲一行命令就能切换试试。

原文

01:55

Decoder@Jonathan Kemper

精选

智谱AI推出开源模型GLM-5.2，采用MIT许可证，支持稳定100万token上下文。在FrontierSWE编码基准测试中，GLM-5.2以1个百分点之差落后于Anthropic的Claude Opus 4.8。该模型在推理能力上仍显著落后于闭源竞争对手。

AI模型 GLM-5.2 智谱AI Claude Opus 开源模型编码助手

推荐理由：智谱AI的GLM-5.2在长时间编码任务上只比Claude Opus 4.8差1%，还是开源免费，码农可以试试。

原文

01:30

marktechpost@Asif Razzaq

Vercel 开源了 Eve，这是一个 Apache-2.0 许可的 AI Agent 框架，目前处于公开预览阶段。每个 Agent 被定义为一个包含配置和能力的文件目录，内置了持久化执行、沙箱、审批、连接、通道和评估功能。开发者可使用 npx eve@latest init 快速搭建项目，并通过 vercel deploy 直接部署无需修改。

AI模型 Eve Vercel 智能体开源模型编程助手

推荐理由：Vercel 出了个开源 Agent 框架 Eve，把 Agent 做成文件目录，自带沙箱和评估，用 npx init 就能部署，挺省事的。

原文