全部 AI 动态 · AI 热点

6月25日

23:57

Gary Marcus@GaryMarcus

Alice预测未来2年内AI股票泡沫崩溃，市场将出现类似2008年的大规模修正。大部分AI公司倒闭，但云提供商和芯片制造商可能幸存。Anthropic和OpenAI等推理公司可能被政府救助否则违约。AI应用集中在聊天机器人、设备端助手（苹果）和医疗影像，主要由开源或设备端模型驱动。教育领域AI使用降低学生质量，学校转向课堂纸笔考试。

行业 Anthropic OpenAI 开源模型设备端模型

推荐理由：一位读者做出了具体AI行业预测，从泡沫到公司倒闭、从开源主导到教育影响，观点尖锐，值得一读。

原文

17:27

Stanford AI Lab@StanfordAILab

精选

Stanford AI Lab发布OpenThoughts-Agent-v2和OpenThinkerAgent-32B，两者均基于Qwen-3开源数据。在计算控制比较中，该模型在全部训练规模下领先，并在7个agent基准测试上平均得分44.8%。模型在终端使用和编码任务上表现突出，且泛化能力强。

AI模型 OpenThoughts-Agent-v2 Qwen-3 Stanford AI Lab 开源模型智能体

推荐理由：斯坦福开源了新agent模型，基于Qwen-3在7个基准上平均44.8%，小模型也能打，值得一试。

原文

17:26

berryxia@berryxia

Unsloth团队将GLM-5.2模型压缩至1-bit量化版本，在Mac Studio M3 Ultra（256GB RAM）上实现约21 tok/s的推理速度。该量化模型在创意输出任务（如HTML/设计生成）上，能与Claude Opus和GPT-5.5正面对比且不落下风。这显示极端量化后的大模型仍能保留较强表现，展示了开源模型通过优化缩小与闭源前沿模型在实际可用性上的差距。

AI模型 Unsloth GLM-5.2 量化开源模型本地部署

推荐理由：Unsloth把GLM-5.2压到1-bit，Mac Studio上跑21 tok/s，创意性居然不输Claude Opus，本地部署党有福了。

原文

16:54

16:54IT之家（博客/媒体）

月之暗面B端负责人黄震昕在亚马逊云科技中国峰会上表示，Kimi的B端业务占比持续提升，海外业务快速增长，员工规模仅300多人且优先投入模型研发。用户对高性能Token有溢价支付意愿，但Kimi通过Cache命中率优化等技术降低成本，目前Cache命中率已超过90%。6月12日月之暗面开源了Kimi K2.7 Code编程模型，相比K2.6在长上下文编程指令遵循和长程编程任务性能上显著提升，平均token消耗减少30%。

AI模型 Kimi K2.7 Code 月之暗面编程助手开源模型

推荐理由：月之暗面想和OpenAI、Google、Anthropic掰手腕，B端业务起来了，还开源了编程模型K2.7 Code，token省30%。

原文

14:45

Fireworks AI@FireworksAI_HQ

精选

Fireworks AI 与 Harvey 合作研究发现，将前沿闭源模型（如 Opus 4.8）作为顾问代理，与微调的开源工作代理结合，在三个基准测试中均取得更优结果。相比全部使用 Opus 4.8，该混合方案成本降低40-67%。该方法简单部署即可提升效果，为模型调用提供新思路。

AI模型 Fireworks AI Harvey Opus 4.8 开源模型推理模型

推荐理由：Fireworks AI 的实验证明，把闭源大模型当参谋、开源模型当打手，效果更好还省40%-67%的钱，值得关注。

原文

11:36

AI Will@FinanceYF5

Reflection 与 SpaceX 签署了一项价值 63 亿美元的算力协议。根据协议，Reflection 将立即获得 GB300 资源用于训练开源模型，并从 2026 年 7 月 1 日起至 2029 年每月向 SpaceX 支付 1.5 亿美元。该协议由 CNBC 首次披露，涉及 SpaceX 在 AI 算力领域的重大商业合作。

行业 SpaceX Reflection 算力协议 GB300 开源模型

推荐理由：SpaceX 和 Reflection 签了 63 亿美元的大单，提供 GB300 算力给训练开源模型，从 2026 年每月付 1.5 亿，挺大的动静。

原文

09:38

arXiv cs.AI@Ke Zhao, Zixiang Di, Hong Qian, Xiang Shu, Yaolin Wen, Qitao Shi, Bingdong Li, Xingyu Lu, Xiangfeng Wang, Jun Zhou, Ke Tang, Yang Yu

MiniOpt是一种强化学习框架，采用“推理-建模-求解”范式来优化问题。其OptReward奖赏函数通过分层分数结构联合评估建模与求解，避免专家演示依赖。在少于10B参数的模型中，MiniOpt系列取得最高平均求解精度(SA)。MiniOpt-3B在多种优化类型和任务领域展示强泛化能力，代码已开源。

AI模型 MiniOpt 强化学习优化开源模型 LLM

推荐理由：想用小型模型搞定各种优化问题？MiniOpt用3B参数就做到了不错的效果，而且代码开源随便玩。

原文

09:37

arXiv cs.AI@Tianyu Dong, Yangyang Liu, Jiang Zhou, Xinwei Wu, Xiaohu Zhao, Hao Wang, Heng Liu, Linlong Xu, Longyue Wang, Weihua Luo, Shaolin Zhu, Deyi Xiong

稀疏MoE（Mixture-of-Experts）模型在多语言场景下，低资源语言因数据稀缺导致路由与高资源语言不一致，限制跨语言知识共享。为此提出SARA（Semantically Anchored Routing Alignment）框架，利用对称JS散度对齐路由分布。在Qwen3-30B-A3B和Phi-3.5-MoE-instruct两个模型上，针对5种低资源语言和3个基准测试，SARA在Global-MMLU上分别提升0.8%和1.2%。该方法不依赖输出logits蒸馏，直接对齐内部路由机制，有效缓解低资源语言瓶颈。

论文 SARA MoE Qwen3 多语言模型开源模型

推荐理由：论文提出SARA方法，用语义锚对齐MoE路由，让低资源语言也能用好专家能力，Global-MMLU提升0.8%-1.2%。

原文

09:30

Jerry Liu@jerryjliu0

精选

Unlimited OCR是百度开源的OCR模型，总参数量3B，仅500M激活。它在表格解析和阅读顺序方面表现优秀，在OmniDocBench v1.5和v1.6上达到SOTA。核心创新是Reference Sliding Window Attention（R-SWA），能保持恒定KV缓存大小，单次前向传递处理40+页文档。与PaddleOCR-VL-1.6对比显示，它在语义格式和图表方面略有不足。

AI模型 Unlimited OCR Baidu PaddleOCR-VL-1.6 OCR 开源模型

推荐理由：百度开源了Unlimited OCR，3B参数却只有500M激活，表格解析超强，能一次性读完40页文档，比PaddleOCR-VL-1.6强在表格和阅读顺序上。试试看？

原文

07:59

Fireworks AI@FireworksAI_HQ

Fireworks AI 与 Cursor 合作，让用户在 Cursor 中即可切换至最新的开源前沿模型 GLM 5.2，无需更换编程工具。该模型在多项评估中获得提升，具体基准成绩见原文链接。这意味着开发者可以轻松尝试 GLM 5.2 的代码能力，而无需离开日常使用的 AI 编程助手。

AI模型 GLM 5.2 Cursor Fireworks AI 开源模型编程助手

推荐理由：Fireworks 和 Cursor 联手，让你直接在 Cursor 里换用最新的 GLM 5.2 模型，省去切换工具的麻烦。

原文

02:24

Clement Delangue@ClementDelangue

精选

Kog在HuggingFace上开源了其2B参数模型，该模型此前被用于演示，运行速度达到3000+ tokens每秒。开源模型可供开发者下载和部署，适用于快速推理场景。

AI模型 Kog HuggingFace 2B模型开源模型推理速度

推荐理由：Kog开源了一个2B模型，每秒能处理3000多个token，适合需要高速推理的任务。

原文

6月24日

12:39

小互@imxiaohu

精选

百度开源的Unlimited OCR模型采用参考滑动窗口注意力（R-SWA）技术，能在32K上下文内一次前向推理处理数十页文档，无需分页。模型仅3B参数、500M激活，显存和算力不随页数增长。传统逐页OCR需要拼接结果，而R-SWA模拟人类连续抄写，始终记忆固定大小的文本。该模型据称基于DeepSeek OCR核心贡献者开发，已在标准长度文档上测试。

AI模型 Unlimited OCR 百度 R-SWA OCR 开源模型

推荐理由：百度开源了一款OCR模型，3B参数就能一次处理几十页PDF，不用切页，比传统逐页OCR强太多。

原文

12:13

arXiv cs.AI@Negin Raoof, Richard Zhuang, Marianna Nezhurina, Etash Guha, Atula Tejaswi, Ryan Marten, Charlie F. Ruan, Tyler Griggs, Alexander Glenn Shaw, Hritik Bansal, E. Kelly Buchanan, Artem Gazizov, Reinhard Heckel, Chinmay Hegde, Sankalp Jajee, Daanish Khazi, Emmanouil Koukoumidis, Xiangyi Li, Hange Liu, Shlok Natarajan, Harsh Raj, Nicholas Roberts, Ethan Shen, Nishad Singhi, Michael Siu, Ashima Suvarna, Hanwen Xing, Patrick Yubeaton, Robert Zhang, Leon Liangyu Chen, Xiaokun Chen, Steven Dillmann, Saadia Gabriel, Xunyi Jiang, Anurag Kashyap, Boxuan Li, Yein Park, Minh Pham, Sujay Sanghavi, Lin Shi, Ke Sun, Yixin Wang, Zhiwei Xu, Erica Zhang, Siyan Zhao, Wanjia Zhao, Jenia Jitsev, Alex Dimakis, Benjamin Feuer, Ludwig Schmidt

OpenThoughts-Agent项目提出一个完全开源的数据整理流程，用于训练通用智能体模型。研究团队进行超过100次对照实验，系统分析了数据来源和多样性的重要性。基于该流程构建了10万样本的训练集，微调Qwen3-32B模型后，在7个智能体基准上平均准确率达44.8%，比最强开源模型Nemotron-Terminal-32B（40.9%）提升3.9个百分点。该训练集在计算量可控的对比中表现出强扩展性，所有数据、管道和模型已在openthoughts.ai开源。

论文 OpenThoughts-Agent Qwen3-32B Nemotron-Terminal 智能体开源模型

推荐理由：想自己训练智能体模型？这里有开源的数据配方和100次实验的经验，帮你少走弯路。

原文

09:46

arXiv: DeepSeek@Haichao Chen, Songchi Zhou, Zhengyun Zhao, Shikai Hu, Xianghong Jin, Hongwei Ji, Li He, Shuli Li, Yiming Qin, Xin Tan, Runfeng Shi, Yih Chung Tham, Jiaye Zhu, Ye Li, Ye Jin, Longhao Cao, Dawei Li, Honghan Wu, Hongqiu Gu, Guanqiao Li, Tudor Groza, Chunying Li, Dian Zeng, Weihong Yu, Gareth Baynam, Saumya Shekhar Jamuar, Min Shen, Shuyang Zhang, Bin Sheng, Sheng Yu, Tien Yin Wong

71°

RaDaR是一个32B参数的开源推理大模型，专为罕见病诊断设计。它在公开基准和四个外部验证中心中优于包括671B DeepSeek-R1在内的开源模型。在回顾性队列中，RaDaR在61.06%的病例中比临床怀疑更早给出最终诊断，提前时间1.87个月。在随机医生辅助试验中，RaDaR帮助医生诊断准确率提高21.44个百分点。合成数据消融实验表明表型锚定叙事对长尾罕见病提供有用训练信号。

AI模型 RaDaR DeepSeek-R1 开源模型罕见病诊断推理模型

推荐理由：RaDaR发布了一个32B开源推理模型，罕见病诊断比DeepSeek-R1还强，医生用它准确率提升21%。

原文

09:26

Fireworks AI@FireworksAI_HQ

FireConnect 是 Fireworks 推出的工具，可将 GLM-5.2、Minimax、Qwen、Deepseek、Kimi 等开源模型直接引入 Claude Code、Pi、OpenCode 和 Codex。用户需依次执行 npm 安装 Claude Code、获取 Fireworks API 密钥、运行单行命令安装 FireConnect 并配置密钥。Head of AI Education Sinan Ozdemir 演示了通过 fireconnect claude model select 切换模型的步骤。整个过程无需手动编辑 JSON 或使用 vim。

技巧 FireConnect Claude Code 开源模型编程助手

推荐理由：FireConnect 让你在 Claude Code 里直接跑 GLM-5.2 等开源模型，一行命令搞定，不用折腾配置。

原文

06:03

OpenRouter@OpenRouterAI

OpenRouter 宣布提供 GLM 5.2 模型的所有服务商入口，共列出 20 个提供商。其中一条服务线路的推理速度超过 125 tokens/秒。用户可在单一页面比较并选择不同服务商。这标志着 GLM 5.2 的部署生态进一步开放。

AI模型 GLM 5.2 OpenRouter 开源模型推理模型高速推理

推荐理由：想用 GLM 5.2 但不清楚哪家快？OpenRouter 把 20 个提供商列在一起了，还能直接选超 125 TPS 的那条线。

原文

03:18

NVIDIA AI@NVIDIAAI

精选

NVIDIA发布DFlash，一种开源轻量级块扩散模型，专为投机解码设计。在NVIDIA Blackwell硬件上，DFlash可实现高达15倍的推理吞吐量提升，同时保持相同的用户交互响应速度。与传统逐token解码不同，DFlash一次生成整个token块，由主模型并行验证。该方案即插即用，已集成到SGLang、TensorRT-LLM和vLLM等框架中。

AI模型 DFlash NVIDIA Blackwell 投机解码开源模型

推荐理由：NVIDIA开源了DFlash，用块扩散投机解码让Blackwell推理提速15倍，还支持SGLang和vLLM，随手就能用。

原文

00:07

berryxia@berryxia

71°

腾讯开源EdgeOne Makers平台，核心是让AI Agent通过一句话自动完成Web应用部署。用户只需告诉Agent“把这个Next.js项目部署了”，系统通过CLI自动执行Git推送、CI/CD触发、边缘函数部署和预览链接生成。平台提供标准化Skill系统，包含边缘函数、云函数、KV存储等模块，支持Node.js、Go、Python三种语言云函数及V8边缘运行时。Claude Code、Cursor、CodeBuddy等AI Agent可直接调用Skill文档操控部署流程。GitHub仓库已开源，集成LangGraph、Claude SDK、OpenAI Agents等主流Agent框架。

AI产品 EdgeOne Makers 腾讯 AI Agent 云平台开源模型

推荐理由：腾讯搞了个新玩意EdgeOne Makers，Agent说句话就能自动部署应用，不用再手动点控制台了，开源直接能用。

原文

6月23日

19:03

19:03IT之家（博客/媒体）

网易有道发布Confucius4-TTS，这是业内首个支持14种语言跨语种无口音的开源TTS模型。用户仅需提供3秒音频素材，无需参考文本即可完成零样本语音克隆，克隆音色与原声相似度超85%，准确度达97%。模型采用GPT式语义大模型搭配Flow Matching流匹配生成框架，支持音频Prompt情感克隆迁移，可跨语种保留语调韵律。全量开源（Apache协议），提供54GB完整资源包，商用无限制，适用于多语种内容生成、数字人配音等场景。

AI模型 Confucius4-TTS 网易有道语音克隆开源模型 TTS

推荐理由：网易新开源Confucius4-TTS，3秒克隆你的声音，还能用这个声音说14种外语没口音，全开源随便用，做配音超方便。

原文

18:25

18:25IT之家（博客/媒体）

英国政府拨款6000万英镑（约5.39亿元人民币）为牛津大学和UCL建立两座AI实验室，重点开发低硬件需求的开源AI模型。项目将与美国闭源高算力方案形成对比，旨在减少对大型科技公司产品的依赖。两所大学还额外拨款200万英镑（约1795.8万元人民币）培养博士生，并至少招聘10名研究人员。AI事务部长Kanishka Narayan表示此举将让AI更便宜、更易部署，确保英国处于领先地位。

行业英国政府开源模型牛津大学 UCL AI实验室

推荐理由：英国砸6000万英镑搞开源AI实验室，专门做低算力模型，想摆脱对美国大厂的依赖，和闭源路线对着干。

原文

17:33

Aravind Srinivas@AravSrinivas

精选

Perplexity 的 Agent API 新增了对智谱 AI 旗舰模型 GLM-5.2 的支持。GLM-5.2 是目前最强的开源模型之一，在长周期编码和智能体工作流上表现突出。它充分利用了 Perplexity 的 Search as Code 架构，用户通过一次 API 调用即可结合前沿推理与实时程序化搜索。该接口兼容 OpenAI 格式，且 Perplexity 提供第一方定价，无额外加价。

AI模型 GLM-5.2 Perplexity Agent API 开源模型智能体

推荐理由：Perplexity Agent API 现在能调用 GLM-5.2 了，这个模型编码和智能体任务很强，还能边推理边搜索，价格也透明。

原文

14:46

向阳乔木@vista8

76°

百度发布Unlimited OCR，模拟人类抄书注意力模式，每生成一个token时参考完整图像和提示词，但输出侧仅回看前128个token。KV缓存固定为128长度，避免长文档推理时内存爆炸。在超长文档OCR任务上效果显著，已在GitHub和Hugging Face开源。

AI模型 UnlimitedOCR 百度 OCR 推理模型开源模型

推荐理由：百度开源了一个超聪明的OCR方案，用固定128 token缓存模拟人眼抄书，长文档不爆内存，快去试试！

原文

14:45

向阳乔木@vista8

百度近日开源了Unlimited OCR模型，参数量3B但仅需500M激活参数。该模型参考了滑动注意力窗口技术，在OCR任务上取得了出乎意料的好效果。轻量级设计使其更易于部署。

AI模型百度 Unlimited OCR OCR 开源模型滑动注意力

推荐理由：百度刚开源的Unlimited OCR，3B参数只激活500M，效果居然这么强，做OCR的赶紧看看。

原文

14:06

lmarena.ai@lmarena_ai

NVIDIA 的 Cosmos 3 Super 在 Text-to-Image Arena 开放模型排名中位列第8和第11（两个变体），整体排名第49和第54。其中 #8 的 Cosmos-3-Super-Text2Image 与 Flux-2-Klein-9B 和 Qwen Image Prompt Extend 持平。#11 的 Cosmos-3-Super-Text2Image (Agentic) 与 Qwen-Image 和 Ideogram-v3-Quality 等模型持平。这些排名体现了 NVIDIA 对开源生态的贡献。

AI模型 Cosmos-3-Super NVIDIA Text-to-Image Arena 文本到图像开源模型

推荐理由：NVIDIA 这个开源文生图模型在排行榜上跟 Flux、Qwen 差不多水平，想试试免费好用的生成工具可以关注它。

原文

14:03

OpenRouter@OpenRouterAI

GLM 5.2 自发布以来在 OpenRouter 平台上的 token 消耗占比迅速上升，与早先发布的 DeepSeek V4 形成竞争。OpenRouter 数据显示，GLM 5.2 的开源模型采纳速度超过多数同类产品。目前两者在 token 份额上差距缩小，但 DeepSeek V4 仍占一定优势。

行业 GLM 5.2 DeepSeek V4 OpenRouter 开源模型 token份额

推荐理由：OpenRouter晒出了GLM 5.2和DeepSeek V4的token份额对比，GLM 5.2涨得真快，开源模型里能跟DeepSeek掰手腕了。

原文

13:55

Geek@geekbb

精选

百度开源了一个基于DeepSeek-OCR升级的视觉语言模型OCR项目，支持一次性解析超长文档。该模型提供两种推理模式：gundam模式用于处理单张图片中的密集文字，base模式适用于多页文档或PDF。项目代码已在GitHub上发布，允许开发者直接使用。

AI模型百度 DeepSeek-OCR 视觉语言模型 OCR 开源模型

推荐理由：百度开源的OCR模型，在DeepSeek-OCR上做了升级，能一次性处理超长文档和密集文字，两种模式很实用。

原文

10:33

berryxia@berryxia

百度开源的 Unlimited OCR 模型采用 R-SWA 注意力机制，支持 32K 上下文窗口，一次前向推理即可完成几十页文档的转录。其核心卖点是 One-Shot Long-Horizon Parsing，无需分页处理，KV Cache 大小恒定。技术报告提到该模型融合了来自 DeepSeek-OCR 的高压缩编码器，且部分核心贡献者与 DeepSeek 有渊源。

AI模型 Unlimited OCR 百度 R-SWA OCR 开源模型

推荐理由：百度搞了个挺牛的 OCR 模型，能一口气读几十页，不像以前那样一页一页循环。开源了，谁都能试试。

原文

02:26

LangChain@LangChainAI

LangChain 宣布其通用开发者工具 dcode 现已支持 GLM 5.2 模型。用户可直接在 dcode 中运行该开源模型，无需额外配置。dcode 是提供商无关的工具，也兼容其他最新的开源模型。详情可查阅 LangChain 文档。

AI模型 GLM 5.2 dcode LangChain 开源模型

推荐理由：LangChain 出了个叫 dcode 的工具，现在能跑 GLM 5.2 模型了，而且是开源的，想尝鲜直接上手。

原文

01:03

Clement Delangue@ClementDelangue

HuggingFace 平台上的公开模型数量即将突破300万个，公开数据集也即将达到100万个。该平台已成为开源AI社区的核心枢纽，模型和数据集数量在过去一年快速翻倍。这一里程碑反映了开源AI生态的持续繁荣。

行业 HuggingFace 开源模型数据集社区里程碑

推荐理由：HuggingFace 马上要突破300万模型和100万数据集了，这说明开源AI有多火。看看这个数字，社区力量真强。

原文

6月22日

23:55

elvis@omarsar0

精选

该报告构建了五维分类法（对手方、载荷、交互状态、发现机制、模式灵活性），分析了九个活跃维护的开源智能体协议，包括MCP和A2A。报告发现每个智能体间协议都采用混合载荷与会话状态持久化组合，而去中心化发现机制仍属罕见。该研究映射了当前LLM agent通信层的标准化趋势，为选择通信层提供依据。论文地址：arxiv.org/abs/2606.19135。

论文 MCP A2A 智能体多智能体系统开源模型

推荐理由：如果你在选agent通信协议，这篇把MCP、A2A等9个协议的底层模式画清楚了，指出状态化会话是共识，去中心化发现还缺。

原文

23:24

23:24IT之家（博客/媒体）

SpaceX与开源AI初创公司Reflection AI签署算力合作协议，最高价值63亿美元（约427.71亿元人民币）。根据协议，Reflection将立即获得英伟达GB300 AI芯片使用权，用于训练和运行高级模型。Reflection同意从2026年7月1日至2029年底每月向SpaceX支付1.5亿美元（约10.18亿元人民币）。合约生效满三个月后，任意一方可提前90天终止。Reflection是开源AI企业，尚未发布前沿级模型，但参与美国能源部创世纪计划和五角大楼AI计划。

行业 SpaceX Reflection AI GB300 开源模型算力合作

推荐理由：SpaceX签了个63亿美元的大单，和开源AI公司Reflection合作，对方能用上英伟达GB300芯片，行业风向标啊。

原文

16:45

16:45IT之家（博客/媒体）

71°

京东发布并开源了实时视频视觉语言交互模型JoyAI-VL-Interaction，这是全球首个全栈开源的interaction模型和系统，获得vLLM-Omni的day-0原生支持。该模型能持续观察视频流，自主判断何时响应，而非被动等待用户提问。在58个真人盲评案例中，JoyAI-VL-Interaction对比豆包视频通话助手胜率77.6%，对比Gemini视频通话助手胜率87.9%。它支持摄像头、直播流、监控流等多种视频输入，并具备后台智能体委托能力。

AI模型 JoyAI-VL-Interaction 京东多模态智能体开源模型

推荐理由：京东开源了JoyAI-VL-Interaction，能实时看视频主动说话，安防、直播都能用，盲评胜率比豆包和Gemini高一大截。

原文

12:54

量子位@思邈

清华大学团队开源的空间智能模型被ECCV 2026接收。该模型在空间理解基准上得分超过Gemini。它能够处理120分钟的长视频并保持上下文。模型权重和代码已开源。

AI模型空间模型 ECCV2026 清华 Gemini 开源模型

推荐理由：清华这套空间模型在ECCV 2026上把Gemini比下去了，还能边看两小时长视频边记，玩空间理解的同学可以试试。

原文

12:26

shao__meng@shao__meng

GLM-5.2 在 X 平台被广泛讨论，声称是最强开源模型且接近 Claude Fable 5。作者下载了 Zcode 平台并发现可以免费试用。但第二条消息即遇到使用限制，未充值 Coding Plan 可能无法正常使用。

技巧 GLM-5.2 Zcode 开源模型免费试用

推荐理由：想了解 GLM-5.2 和 Zcode 的实际体验？这篇分享告诉你免费试用背后的限制

原文

12:24

歸藏(guizang.ai)@op7418

Anthropic已训练完成更强版本的Mythos模型，可能命名为Mythos 5.1或Mythos 6。目前不确定是否会公开发布或仅用于内部加速开发。消息称停止发布Fable 5或Mythos 5不会减慢进展，反而释放资源。竞争压力来自开源模型如GLM-5.2，迫使前沿实验室持续训练更强系统。

AI模型 Anthropic Mythos GLM-5.2 推理模型开源模型

推荐理由：有人说Anthropic偷偷训了个更强的Mythos，但可能不对外放。想了解AI前沿动态可以看看。

原文

10:43

pandaily@contact@pandaily.com (Pandaily)

微软因AI推理token成本飙升，宣布Copilot Cowork产品改为基于使用量的定价模式。为控制成本，微软选择整合开源模型DeepSeek V4作为替代方案。这一决策反映了大型企业在大规模AI部署中面临的经济压力，以及开源模型在成本效率上的竞争力。DeepSeek V4的参数量与性能表现接近GPT-4级别，但推理成本可降低80%以上。

AI产品微软 DeepSeek V4 定价策略开源模型 AI成本

推荐理由：微软的Copilot因为Token太贵改用DeepSeek了，以后按用量计费，用多少付多少。想省钱的话可以关注这个开源模型。

原文

6月21日

23:28

Harrison Chase@hwchase17

社区文章演示了如何借助Deep Agents框架构建一个类似Claude Code的编程智能体。文章特别提到GLM-5.2模型表现强劲，可作为该智能体的底层推理引擎。通过3个步骤即可完成部署，无需从头开发复杂Agent系统。

技巧 Deep Agents Claude Code GLM-5.2 智能体开源模型

推荐理由：教你用Deep Agents自己搭一个Claude Code同款智能体，还顺带体验GLM-5.2的威力，实操性很强。

原文

15:25

@koltregaskes@koltregaskes

GLM-5.2 在 DeepSWE 编程基准上取得 44% 的得分，超过 Kimi-K2.7 Code，成为目前最强的开源模型。不过它的运行成本更高，且每次输出更多 tokens。与封闭模型相比，Claude Fable 5 以 70% 的得分领先，差距明显。

AI模型 GLM-5.2 Kimi-K2.7 DeepSWE 开源模型代码生成

推荐理由：智谱的 GLM-5.2 代码上刚赢了 Kimi 的 K2.7，但更贵输出也更多，离顶级闭源还有距离。

原文

06:55

ollama@ollama

Ollama 转发了 Aaron Levie 的观点，指出开放权重模型在特定任务上已取得 SOTA 结果，并在编码等部分领域接近前沿水平。Levie 强调，开放权重模型与前沿模型之间的边际差距若能保持而非扩大，将创造更多 AI 应用价值。他还提到，使用更便宜或针对特定任务微调的开放模型可优化成本，同时前沿模型仍可用于规划、编排等复杂工作。

行业 Ollama open weights 开源模型 AI成本具体任务微调

推荐理由：Ollama 分享了 Levie 对开放权重模型的乐观看法：这些模型成本更低、表现接近前沿，还能针对性微调，对 AI 应用层是大利好。

原文

05:58

marktechpost@Michal Sutter

Nous Research为其开源智能体框架Hermes Agent新增了Blank Slate模式。该模式默认仅启用provider、model、File Operations和Terminal四项基础功能。用户通过platform_toolsets.cli和disabled_toolsets命令行接口手动添加其他工具集，实现从零开始配置。这种设计避免了预装过多工具，提升了Agent的灵活性和可控性。

AI模型 Hermes Agent Nous Research 智能体工具集开源模型

推荐理由：想精细控制Agent工具？Nous Research给Hermes Agent加了Blank Slate模式，从零选工具，不预装一堆，清爽又可控。

原文