12:31IT之家(博客/媒体)73°华为于6月30日正式开源 openPangu-2.0-Flash 模型,总参数量92B,激活参数量6B,支持512K上下文长度。该模型基于昇腾原生训练与推理技术开发,旨在为业界提供最佳实践参考。同时,计划于7月开源 openPangu-2.0-Pro 模型,总参数量505B,激活参数量18B。开源内容包括模型权重、基础推理代码、训推算子以及预训练和后训练代码。AI模型openPangu华为盘古开源模型512K上下文推荐理由:华为把92B参数的Flash模型开源了,512K上下文,还有505B的Pro版下月来,搞Agent底座的别错过。原文
01:17Simon Willison’s Weblog(博客/媒体)精选DeepReinforce 发布 Ornith-1.0,一款 MIT 许可的开源模型,基于 Gemma 4 和 Qwen 3.5 预训练。提供 9B Dense、31B Dense、35B MoE 和 397B MoE 四种规格。在编码基准上达到同尺寸开源模型 SOTA。作者在 LM Studio 上测试 35B Q4_K_M GGUF 版本,能流畅运行代理工具调用并处理代码定位任务。AI模型Ornith-1.0DeepReinforceGemma 4Qwen 3.5开源模型1 个信源在谈推荐理由:DeepReinforce 新出的开源编码模型,基于 Gemma 4 和 Qwen 3.5,在代理编码任务上表现不错,LM Studio 就能跑,值得试试。原文
16:27Pandaily@contact@pandaily.com (Pandaily)精选73°DeepSeek 与北京大学联合开发的 DSpark 推理系统获得 PyTorch 核心维护者 Dmytro Dzhulgakov 的详细技术分析。他重点称赞 DSpark 的半并行草稿(semi-parallel drafting)机制,能提升推理吞吐量。分析指出该系统达到生产级工程水平(production-grade engineering),在特定负载下相比基线有显著加速。这一评测为开源推理系统提供了高含金量的第三方验证。AI模型DeepSeekDSparkPyTorch推理模型开源模型推荐理由:PyTorch 核心大佬亲自下场拆解 DeepSeek 的 DSpark,说它半并行草稿很牛、工程落地扎实,搞推理优化的必看。原文
00:16量子位@听雨Yuxinlu1在Hugging Face模型排行榜上击败多家大厂模型,登顶多个细分榜单。该账号发布的模型综合得分领先于Meta、Google等公司的开源项目。排行榜显示其推理效率与准确率均达到SOTA水平。AI模型yuxinlu1Hugging Face模型排行榜开源模型推荐理由:一个个人开发者干翻大厂,看看yuxinlu1到底做了什么模型这么强原文
16:03Decoder@Jonathan Kemper精选新浪微博发布开源模型VibeThinker-3B,仅30亿参数。在数学和编程基准上,它匹配了DeepSeek V3.2和Kimi K2.5,后两者参数规模大333倍。模型通过多阶段后训练实现高性能。研究人员假设:逻辑推理可压缩进小模型,但广泛世界知识不行。AI模型VibeThinker-3B新浪推理模型开源模型推荐理由:30亿参数的小模型推理能力居然能打千亿级大模型,新浪VibeThinker-3B在数学和编程上很强,而且开源了。原文
14:34量子位@林樾百度在GitHub开源了全新OCR模型,模型名称暂未公开,但根据展示能一次性识别整本图书内容。该模型作者被社区推测为前DeepSeek研究员。项目已在GitHub托管,提供预训练权重和API文档。AI模型百度OCR开源模型DeepSeek推荐理由:百度搞了个能扫整本书的OCR,还开源了,做文档处理的可以试试。原文
13:01marktechpost@Asif Razzaq精选Liquid AI 发布了 LFM2.5-230M,这是其最小的 230M 参数开源权重模型。该模型在 Galaxy S25 Ultra 上达到 213 tok/s,在 Raspberry Pi 5 上为 42 tok/s。基于 LFM2 架构,它专注于工具使用和数据提取,在指令遵循上击败了 Qwen3.5-0.8B 和 Gemma 3 1B 等更大模型。模型支持 llama.cpp、MLX、vLLM、SGLang 和 ONNX 框架。AI模型LFM2.5-230MLiquid AI开源模型设备端推理推理框架1 个信源在谈推荐理由:Liquid AI 出了个超小模型 LFM2.5-230M,手机跑 213 tokens 每秒,树莓派也能跑 42,指令遵循还比 Qwen3.5-0.8B 和 Gemma 3 1B 强。原文
19:36Sebastian Raschka: Ahead of AI@Sebastian Raschka, PhD精选本文介绍如何用aider和Continue等本地编码代理工具替代Claude Code与GitHub Codex订阅。这些工具可搭配Ollama部署的Llama 3和DeepSeek Coder等开源模型。本地运行能保护代码隐私,并节省每月订阅费用。作者给出了从安装Ollama到连接模型的完整配置步骤。技巧Claude CodeCodexaider编程助手开源模型推荐理由:想省掉Claude Code的月费?Sebastian手把手教你用本地开源模型加aider和Continue自己搭编码代理,便宜又安全。原文
15:51IT之家(博客/媒体)76°6月27日,北大与DeepSeek联合开源DSpark推理加速框架,已部署于DeepSeek-V4-Flash与V4-Pro预览版引擎。该框架相比单token推测解码基线MTP-1,在同等吞吐量下将单用户生成速度提升60%至85%。DSpark采用半自回归架构,在Qwen3-4B模型上平均接受长度比Eagle3提升约30.9%,比DFlash提升约16.3%。V4-Flash引擎实测中,80 token/s SLA下聚合吞吐量提升51%,120 token/s下提升661%。相关论文、训练代码及模型检查点已在GitHub DeepSpec项目开源。AI模型DeepSeekDSpark北京大学推理模型开源模型1 个信源在谈推荐理由:北大和DeepSeek开源了DSpark,能让高并发下大模型生成速度提升最多85%。想提速可以试试。原文
13:00量子位@鱼羊英伟达开源了一款新的MoE加速库,只需一行import即可集成到Transformers v5中。微调速度提升3.7倍。该库支持专家并行技术,并整合了DeepEP和TransformerEngine组件。用户无需修改现有代码即可获取显著性能提升。AI模型英伟达MoETransformers v5DeepEP开源模型推荐理由:想让你HuggingFace上的MoE模型微调更快?英伟达这个新库一行代码就能加速3.7倍,直接用。原文
10:10pandaily@contact@pandaily.com (Pandaily)智谱AI和MiniMax两家中国AI公司的市场估值出现分化,前者估值约200亿元人民币,后者约150亿元。这一走势与全球市场Anthropic(估值约615亿美元)和OpenAI(估值约3000亿美元)的差距扩大相呼应。双方均聚焦于多模态大模型和智能体应用,但融资速度和商业化路径不同。智谱AI以技术开源和B端合作为主,MiniMax则侧重C端产品与海外市场拓展。行业智谱AIMiniMax估值行业格局开源模型10 个信源在谈推荐理由:聊中国AI格局必看这篇,智谱AI和MiniMax谁更像Anthropic和OpenAI,估值数据和背后逻辑都讲清楚了。原文
16:54IT之家(博客/媒体)月之暗面B端负责人黄震昕在亚马逊云科技中国峰会上表示,Kimi的B端业务占比持续提升,海外业务快速增长,员工规模仅300多人且优先投入模型研发。用户对高性能Token有溢价支付意愿,但Kimi通过Cache命中率优化等技术降低成本,目前Cache命中率已超过90%。6月12日月之暗面开源了Kimi K2.7 Code编程模型,相比K2.6在长上下文编程指令遵循和长程编程任务性能上显著提升,平均token消耗减少30%。AI模型Kimi K2.7 Code月之暗面编程助手开源模型10 个信源在谈推荐理由:月之暗面想和OpenAI、Google、Anthropic掰手腕,B端业务起来了,还开源了编程模型K2.7 Code,token省30%。原文
19:03IT之家(博客/媒体)网易有道发布Confucius4-TTS,这是业内首个支持14种语言跨语种无口音的开源TTS模型。用户仅需提供3秒音频素材,无需参考文本即可完成零样本语音克隆,克隆音色与原声相似度超85%,准确度达97%。模型采用GPT式语义大模型搭配Flow Matching流匹配生成框架,支持音频Prompt情感克隆迁移,可跨语种保留语调韵律。全量开源(Apache协议),提供54GB完整资源包,商用无限制,适用于多语种内容生成、数字人配音等场景。AI模型Confucius4-TTS网易有道语音克隆开源模型TTS推荐理由:网易新开源Confucius4-TTS,3秒克隆你的声音,还能用这个声音说14种外语没口音,全开源随便用,做配音超方便。原文
18:25IT之家(博客/媒体)英国政府拨款6000万英镑(约5.39亿元人民币)为牛津大学和UCL建立两座AI实验室,重点开发低硬件需求的开源AI模型。项目将与美国闭源高算力方案形成对比,旨在减少对大型科技公司产品的依赖。两所大学还额外拨款200万英镑(约1795.8万元人民币)培养博士生,并至少招聘10名研究人员。AI事务部长Kanishka Narayan表示此举将让AI更便宜、更易部署,确保英国处于领先地位。行业英国政府开源模型牛津大学UCLAI实验室推荐理由:英国砸6000万英镑搞开源AI实验室,专门做低算力模型,想摆脱对美国大厂的依赖,和闭源路线对着干。原文
23:24IT之家(博客/媒体)SpaceX与开源AI初创公司Reflection AI签署算力合作协议,最高价值63亿美元(约427.71亿元人民币)。根据协议,Reflection将立即获得英伟达GB300 AI芯片使用权,用于训练和运行高级模型。Reflection同意从2026年7月1日至2029年底每月向SpaceX支付1.5亿美元(约10.18亿元人民币)。合约生效满三个月后,任意一方可提前90天终止。Reflection是开源AI企业,尚未发布前沿级模型,但参与美国能源部创世纪计划和五角大楼AI计划。行业SpaceXReflection AIGB300开源模型算力合作3 个信源在谈推荐理由:SpaceX签了个63亿美元的大单,和开源AI公司Reflection合作,对方能用上英伟达GB300芯片,行业风向标啊。原文
16:45IT之家(博客/媒体)71°京东发布并开源了实时视频视觉语言交互模型JoyAI-VL-Interaction,这是全球首个全栈开源的interaction模型和系统,获得vLLM-Omni的day-0原生支持。该模型能持续观察视频流,自主判断何时响应,而非被动等待用户提问。在58个真人盲评案例中,JoyAI-VL-Interaction对比豆包视频通话助手胜率77.6%,对比Gemini视频通话助手胜率87.9%。它支持摄像头、直播流、监控流等多种视频输入,并具备后台智能体委托能力。AI模型JoyAI-VL-Interaction京东多模态智能体开源模型推荐理由:京东开源了JoyAI-VL-Interaction,能实时看视频主动说话,安防、直播都能用,盲评胜率比豆包和Gemini高一大截。原文
12:54量子位@思邈清华大学团队开源的空间智能模型被ECCV 2026接收。该模型在空间理解基准上得分超过Gemini。它能够处理120分钟的长视频并保持上下文。模型权重和代码已开源。AI模型空间模型ECCV2026清华Gemini开源模型推荐理由:清华这套空间模型在ECCV 2026上把Gemini比下去了,还能边看两小时长视频边记,玩空间理解的同学可以试试。原文
10:43pandaily@contact@pandaily.com (Pandaily)微软因AI推理token成本飙升,宣布Copilot Cowork产品改为基于使用量的定价模式。为控制成本,微软选择整合开源模型DeepSeek V4作为替代方案。这一决策反映了大型企业在大规模AI部署中面临的经济压力,以及开源模型在成本效率上的竞争力。DeepSeek V4的参数量与性能表现接近GPT-4级别,但推理成本可降低80%以上。AI产品微软DeepSeek V4定价策略开源模型AI成本推荐理由:微软的Copilot因为Token太贵改用DeepSeek了,以后按用量计费,用多少付多少。想省钱的话可以关注这个开源模型。原文
05:58marktechpost@Michal SutterNous Research为其开源智能体框架Hermes Agent新增了Blank Slate模式。该模式默认仅启用provider、model、File Operations和Terminal四项基础功能。用户通过platform_toolsets.cli和disabled_toolsets命令行接口手动添加其他工具集,实现从零开始配置。这种设计避免了预装过多工具,提升了Agent的灵活性和可控性。AI模型Hermes AgentNous Research智能体工具集开源模型推荐理由:想精细控制Agent工具?Nous Research给Hermes Agent加了Blank Slate模式,从零选工具,不预装一堆,清爽又可控。原文
10:18pandaily@contact@pandaily.com (Pandaily)小米发布并开源了Miloco 2.0全屋AI系统,具备多模态感知能力,可识别用户行为和场景。该系统支持主动智能,能预测需求并执行持续任务,如自动调节灯光温度。Miloco 2.0拥有家庭记忆功能,可记住家庭成员的偏好和习惯。该系统被比作钢铁侠的JARVIS管家,面向中国家庭提供个性化服务。AI模型小米Miloco 2.0智能家居多模态开源模型推荐理由:小米开源了Miloco 2.0,一个像JARVIS一样有记忆能主动帮忙的智能家居AI,多模态和家庭记忆功能很实用。原文
14:30Latent Space (swyx)(博客/媒体)GLM-5.2在主观体验测试中表现优异,得到社区好评。Z.ai 预测开源项目 Open Fable 将于12月推出。这标志着开源模型在性能上逐步接近前沿水平。AI模型GLM-5.2Z.aiOpen Fable开源模型推荐理由:GLM-5.2这次主观评价不错,开源模型终于开始追上GPT了。Z.ai预测年底会有新开源项目,值得关注。原文
11:27IT之家(博客/媒体)阿里巴巴集团主席蔡崇信在VivaTech 2026上表示,AI总潜在市场规模对标人类生产力,全球GDP超100万亿美元中至少50万亿美元来自人类生产力,这是阿里的目标。阿里全面投入AI,全栈覆盖能源、基础设施、模型和应用层,拥有开源模型千问(Qwen)。蔡崇信指出当前全球AI开源主要推动力量来自中国企业,阿里团队持续贡献前沿模型开源。行业阿里巴巴Qwen开源模型全栈AI推荐理由:阿里主席亲口说了:AI市场对标50万亿美元,全栈押注,千问开源是全球主力。想看清阿里AI战略的必看。原文
12:35IT之家(博客/媒体)73°阿里与人大联合开源 LOGOS,这是一个基于统一“科学语法”的多领域科学生成基础模型。LOGOS-1B 仅用 1B 参数量,在多项科学任务上超越参数为 8×7B 的微软 NatureLM。模型预训练语料涵盖蛋白质(28.9B tokens)、抗体(3.0B tokens)、小分子(2.1B tokens)等 7 类模态共 44.87B tokens。它通过共享词表将异构对象编码为离散 token,无需 3D 坐标即可理解 3D 空间互作规律。LOGOS 已开源模型权重、推理代码与技术报告。AI模型LOGOSNatureLM开源模型科学大模型多模态推荐理由:阿里开源的 LOGOS 模型,用 1/56 参数就碾压了微软 NatureLM,还统一了蛋白质、小分子等科学对象的语言,搞科研的可以看看源码和论文,开箱即用。原文
11:09IT之家(博客/媒体)72°华为昇腾宣布0 Day支持智谱GLM-5.2,昇腾A3系列已实现单双机及大EP推理部署。优化技术包括MOE大融合算子、通信与计算融合、注意力前处理与多Token预测、高并发调度与预填充延迟机制等。GLM-5.2在Code Arena盲测中取得全球可用模型第一,拥有1M上下文能力,长程任务表现介于Claude Opus 4.7与4.8之间。该模型在主流编程基准上保持开源SOTA,并已适配华为昇腾等国产算力平台。AI模型GLM-5.2华为昇腾推理优化开源模型代码生成推荐理由:华为昇腾0 Day适配智谱GLM-5.2,推理优化让长上下文编程更高效,开源模型性能比肩Claude Opus。原文
08:15Simon Willison’s Weblog(博客/媒体)精选73°中国AI实验室Z.ai于6月16日开源GLM-5.2,采用MIT许可证。该模型753B参数、40激活参数(MoE),上下文窗口从GLM-5.1的20万提升至100万。在Artificial Analysis Intelligence Index v4.1上以51分领先MiniMax-M3(44)和DeepSeek V4 Pro(44)。在Code Arena WebDev前端编码排行榜上排名第二,仅次于Claude Fable 5。OpenRouter上输入价格$1.40/百万token,输出$4.40/百万token。AI模型GLM-5.2Z.aiOpenRouter开源模型编程助手4 个信源在谈推荐理由:Z.ai开源了GLM-5.2,纯文本模型在智能和编码基准上超过DeepSeek V4和Kimi K2.6,价格只有GPT-5.5的五分之一。原文
01:55Decoder@Jonathan Kemper精选智谱AI推出开源模型GLM-5.2,采用MIT许可证,支持稳定100万token上下文。在FrontierSWE编码基准测试中,GLM-5.2以1个百分点之差落后于Anthropic的Claude Opus 4.8。该模型在推理能力上仍显著落后于闭源竞争对手。AI模型GLM-5.2智谱AIClaude Opus开源模型编码助手10 个信源在谈推荐理由:智谱AI的GLM-5.2在长时间编码任务上只比Claude Opus 4.8差1%,还是开源免费,码农可以试试。原文
01:30marktechpost@Asif RazzaqVercel 开源了 Eve,这是一个 Apache-2.0 许可的 AI Agent 框架,目前处于公开预览阶段。每个 Agent 被定义为一个包含配置和能力的文件目录,内置了持久化执行、沙箱、审批、连接、通道和评估功能。开发者可使用 npx eve@latest init 快速搭建项目,并通过 vercel deploy 直接部署无需修改。AI模型EveVercel智能体开源模型编程助手推荐理由:Vercel 出了个开源 Agent 框架 Eve,把 Agent 做成文件目录,自带沙箱和评估,用 npx init 就能部署,挺省事的。原文
00:35量子位@henry71°一家头部具身大脑公司完成数亿美元新一轮融资,投资方共15家VC。该公司坚持世界模型技术路线,半年内先后在开源、端侧和训练场三个方向发布方案。具体开源项目名称和端侧部署参数尚未披露。训练场支持与多种机器人硬件适配。该轮融资将用于扩大研发团队和加速产品落地。行业具身智能融资世界模型开源模型端侧部署推荐理由:一家专注具身大脑的公司又融了一大笔钱,世界模型路线,15家VC跟进。开源、端侧、训练场三连发,你可以关注它的技术方案。原文
11:40IT之家(博客/媒体)大晓机器人联合香港中文大学发布并开源具身操作VLA模型ACE-Ego。在RoboCasa GR1 TableTop基准上,ACE-Ego以72.8%平均成功率刷新纪录,超越英伟达GR00T、PI π₀.₅等模型。在RoboTwin 2.0高难度双臂操作测试中,ACE-Ego成功率90.62%。该模型已能稳定完成塑料袋打包、鞋子装入鞋盒等零售操作。AI模型ACE-Ego大晓机器人人形机器人具身智能开源模型推荐理由:大晓机器人开源了新模型ACE-Ego,在人形机器人操作基准上拿了第一,能打包塑料袋、装鞋盒,挺实用的。原文
11:36量子位@十三智谱AI于2026年6月开源了GLM-5.2模型,支持1M上下文长度。该模型在AI编程评测基准上取得第一,超过此前领先的Fable-5。基于GLM架构的持续优化,GLM-5.2在代码生成任务中展现出更强能力。开源版本已发布在GitHub。AI模型GLM-5.2智谱编程助手开源模型长上下文10 个信源在谈推荐理由:智谱开源了GLM-5.2,1M超长上下文,编程能力直接拿下第一,想换编程模型的话可以试试。原文
09:27IT之家(博客/媒体)精选智谱发布并开源 GLM-5.2 模型,支持 1M 无损上下文。在 Code Arena 盲测中取得全球可用模型第一。在多个长程任务基准上表现介于 Claude Opus 4.7 与 4.8 之间。编程基准上保持开源 SOTA,与 Claude Opus 4.8 可比。已适配华为昇腾、平头哥等国产算力平台,单位 token FLOPs 降至 2.9 倍。AI模型GLM-5.2智谱Code Arena开源模型上下文长度推荐理由:智谱的 GLM-5.2 开源了,1M 上下文还拿了 Code Arena 第一,编程和长任务都强,国产算力也能跑。原文
14:55量子位@量子位的朋友们阿里发布Qwen-Robot系列,包含Qwen-Robot-V1、Qwen-Robot-V1-Pro和Qwen-Robot-V1-Plus三款模型。该系列将视觉、语言与行动能力整合,支持在复杂环境中完成抓取、导航等任务。在RoboBench基准上,Qwen-Robot-V1-Pro任务成功率较基线提升15.3%。模型参数规模从7B到72B不等,可适配不同硬件平台。AI模型Qwen-Robot阿里具身大模型机器人开源模型推荐理由:阿里刚出的Qwen-Robot系列,三个模型从7B到72B,让机器人能边看边想边动,RoboBench成绩提升15%,搞具身智能的值得看看。原文
09:37AWS Machine Learning Blog@Aris Tsakpinis精选Google DeepMind 发布的 Gemma 4 开源权重模型系列现已在 Amazon Bedrock 上可用。该系列包含三个指令调优变体:Gemma 4 31B(密集架构)、26B-A4B(MoE 架构,每次激活 4B 参数)和 E2B。所有变体均支持内置推理、原生函数调用以及文本和图像多模态输入。模型基于 Apache 2.0 许可发布,旨在多种部署场景下实现每参数智能最大化。AI模型Gemma 4Amazon BedrockGoogle DeepMind开源模型多模态4 个信源在谈推荐理由:Google DeepMind 把最新的 Gemma 4 放到 AWS 上了,三种规格可选,带推理和图文理解,正好拿来玩开源项目。原文
23:15IT之家(博客/媒体)78°稀宇科技于6月12日开源了 MiniMax M3 模型权重,总参数428B,激活参数23B。M3 是首个从 Step 0 开始进行多模态混合训练的开源模型,支持百万上下文。发布两周后,M3 在 Artificial Analysis 综合智能指数排行榜上获得全球开源模型最高排名。模型输出速度已从30 TPS提升至约80 TPS,后续还将提速30-40%。在编码与智能体评测中达到行业顶尖水平,具备自主任务拆解、工具调用与多步推理能力。AI模型MiniMax M3多模态开源模型百万上下文智能体2 个信源在谈推荐理由:MiniMax 开源了原生多模态巨无霸 M3,428B参数、百万上下文,全球开源排名第一,还能自主拆任务调工具,速度从30飙到80 TPS。原文
23:01IT之家(博客/媒体)巴西IplanRIO发布的Rio-3.5-Open-397B模型在多个基准测试取得SOTA,被奉为拉美开源新势力。上海创智学院Nex团队指控该模型套壳阿里千问Qwen3.5和Nex N2 Pro的权重,并展示证据:无系统提示时模型自称“Nex N2 Pro”且提及“上海创智学院”。IplanRIO在Hugging Face致歉,称因操作失误上传了合并基线版本,承诺后续重新上传正式版。行业Rio-3.5-Open-397BQwen3.5Nex N2 Pro开源模型模型套壳1 个信源在谈推荐理由:巴西公司号称自研的黑马模型,结果是个套壳缝合怪,被扒得底裤都不剩。看看证据有多实锤。原文
16:13量子位@思邈Noiz AI联合香港科技大学和清华大学开源了一款音频生成大模型。该模型仅需4步推理即可生成高质量音频,在单张GPU上推理速度达到0.24秒。其高效架构显著降低了音频生成的计算门槛。开源代码和模型权重已在GitHub发布,支持多种音频生成任务。AI模型音频生成开源模型Noiz AI快速推理推荐理由:噪点AI和港科大、清华联手做了一个音频模型,4步生成只要0.24秒,比同类快很多,还开源了,想玩音频AI的可以试试。原文
14:13marktechpost@Michal Sutter79°Z.ai 于 2026 年 6 月 13 日发布 GLM-5.2,覆盖所有 GLM Coding Plan 层级。该模型支持 100 万 token 的可用上下文窗口,并提供 High 和 Max 两种思考努力级别。GLM-5.2 通过 Anthropic 兼容端点集成到 Claude Code、Cline 和 OpenClaw 等工具中。发布时未公布基准测试结果,MIT 开源权重预计下周发布。AI模型Z.aiGLM-5.2长上下文推理模型开源模型10 个信源在谈推荐理由:Z.ai 的 GLM-5.2 支持百万token上下文,还能选思考深度原文
16:18Pandaily@contact@pandaily.com (Pandaily)72°智谱AI宣布将GLM-5.2模型以MIT许可证开源,支持100万token上下文长度。此举直接回应美国针对Anthropic模型的出口限制。GLM-5.2在多项基准测试中表现优异,其开源策略旨在推动国内AI生态发展。AI模型GLM-5.2Zhipu AI开源模型长上下文MIT许可证10 个信源在谈推荐理由:智谱开源百万token模型原文
23:22IT之家(博客/媒体)智谱发布 AI 编程工具 ZCode 3.0,全面切换自研 ZCode Agent 内核,深度适配 GLM-5.2 模型。GLM-5.2 支持 1M 上下文,是智谱迄今能力最强的开源模型。ZCode 3.0 新增分组式任务工作区、Zread 智能项目知识库、可视化 Git 分支图谱等功能。官方表示整体任务完成效果已显著优于第三方 Agent。AI产品ZCodeGLM-5.2智谱编程助手开源模型推荐理由:智谱自研内核,编程体验升级原文
22:51量子位@鹭羽HuggingFace CEO和Bengio团队推荐的HRM模型,参数量仅1B,训练成本仅1500美元。该模型在多个基准测试中表现优于同规模模型,如MMLU上达到45.2%,HellaSwag上达到72.1%。其核心创新在于高效训练方法,大幅降低了资源需求。AI模型HRMHuggingFaceBengio开源模型推理模型推荐理由:1B模型,1500美元,性能超预期原文