全部 AI 动态 · AI 热点

AITOP

6月18日

15:03

小互@imxiaohu

Apodex 1.0 模型已正式发布，官方介绍页面提供了技术细节。在线体验平台 apodex.ai 可供用户直接试用。模型权重已在 Hugging Face 上开源下载。

AI模型 Apodex 开源模型 Hugging Face

推荐理由：Apodex 发布了 1.0 版本，有在线体验和开源下载，感兴趣可以试试。

原文

13:03

@atomic_chat_hq@atomic_chat_hq

Atomic Chat 正式在 Hugging Face 上线，成为该平台上的 Local App。用户可以直接在本地设备运行 Hugging Face 上的 200,000+ 个开放权重模型，所有处理都在设备端完成，保障隐私。该应用完全开源，无需联网即可使用多种模型。

AI产品 Atomic Chat Hugging Face 本地模型开源模型

推荐理由：Atomic Chat 现在能在本地跑 Hugging Face 上 20 多万个模型，完全离线私密，还开源，搞 AI 的可以试试看。

原文

10:57

Viking@vikingmute

GLM5.2在Artificial Analysis开源模型排名中登顶，多项benchmark评分领先。有用户反馈其实际体验接近Opus 4.6，作者考虑将Deepseek V4 Pro替换为GLM5.2。该帖子获得2条回复、505次浏览。

AI模型 GLM5.2 Artificial Analysis Opus 4.6 Deepseek V4 Pro 开源模型

推荐理由：GLM5.2在开源模型排名拿了第一，而且有人说用起来感觉像Opus 4.6，你要是想换掉Deepseek V4 Pro可以试试。

原文

05:29

ollama@ollama

用户称 GLM 5.2 达到 SOTA 级别的智能，但成本仅为同类模型的一小部分。他认为 GLM 5.2 的输出和个性优于 GPT 5.5。他计划将 GLM 5.2 用于自己的工具 Hermes 以及客户项目中。该推文获得 170 点赞和超 7300 次浏览。

AI模型 GLM 5.2 GPT 5.5 Hermes 开源模型

推荐理由：有人实测后说 GLM 5.2 比 GPT 5.5 更强还便宜，准备放进自己产品用，有参考价值。

原文

04:56

elvis@omarsar0

GLM-5.2 在 Design Arena 设计基准上以 Elo 1360 分排名第一，超越此前第一的 Claude Fable 5。该模型擅长生成游戏、落地页、HTML 组件和 3D 世界等内容。Zai 组织发布了这个开源权重模型，其设计质量被认为接近 Opus 级别。评测显示它相比此前版本提升了 4 个名次和 27 个 Elo 点。

AI模型 GLM-5.2 Zai Design Arena 设计生成开源模型

推荐理由：Zai 开源的 GLM-5.2 在 Design Arena 上干掉了 Claude Fable 5，能设计游戏、HTML 和 3D 世界，不看后悔。

原文

04:01

lmarena.ai@lmarena_ai

AI模型 Agent Arena 智能体开源模型实验室

推荐理由：想对比开源智能体的表现？Agent Arena新排行榜支持按模型或实验室筛选，一目了然。

原文

03:55

LangChain@LangChainAI

LangChain测试显示，Alibaba Qwen基础模型配合良好提示在感知错误分类任务上性能接近前沿模型。使用LoRA SFT微调后，模型性能接近或超过前沿模型。实验表明微调能使开源模型与顶级闭源模型竞争。

AI模型 Qwen Alibaba LoRA 微调开源模型

推荐理由：LangChain实测：Qwen基础版+好提示就能追平顶级模型，微调后甚至超越。开源模型潜力很大！

原文

03:33

lmarena.ai@lmarena_ai

精选

Kimi K2.7 Code 在 Agent Arena 排行榜上总体排名第19，在开源模型中排第6。该模型在 Kimi Code Bench v2 上比 K2.6 提升21.8%，在 Program Bench 上提升11.0%，在 MLS Bench Lite 上提升31.5%。推理 token 使用量降低30%，减少了过度思考。长程编码任务指令遵循和完成率均有提升。目前通过 Kimi API 和 Kimi Code 可用。

AI模型 Kimi-K2.7-Code Kimi_Moonshot 开源模型编程助手推理模型

推荐理由：Kimi 发了新编程模型 K2.7 Code，推理更省 token，基准提升明显，而且在 Agent Arena 上开源模型里排第6，值得一试。

原文

03:30

ollama@ollama

精选

Ollama 宣布用户可以在 Codex App、CLI 和 SDK 中使用 GLM-5.2 和 Kimi-K2.7-Code 模型。此前 Codex 仅支持 OpenAI 模型，现在扩展至开源模型。使用命令 ollama launch codex 即可启用。这一集成让开发者能用更多模型进行代码生成。

AI产品 Ollama Codex GLM-5.2 Kimi-K2.7-Code 开源模型

推荐理由：Ollama 把 GLM-5.2 和 Kimi-K2.7-Code 也带进 Codex 了，以前只能用 OpenAI 模型，现在敲一行命令就能切换试试。

原文

6月17日

23:48

小互@imxiaohu

71°

OpenAI 宣布 Codex 产品，包含 App 客户端、命令行 CLI 和 SDK，允许开发者自由接入任何开源大模型，不强制绑定 OpenAI 自家模型。官方同时发布了手把手配置文档，指导如何将 Codex 底层模型替换为免费开源模型。这一举措为开发者提供了更多选择，降低了对 OpenAI 模型的依赖。

AI产品 OpenAI Codex 开源模型开发工具 CLI

推荐理由：OpenAI 的 Codex 现在能接 DeepSeek 这类开源模型了，开发者可以自己换底层 AI，不用非得用 OpenAI 的。

原文

23:40

Geek@geekbb

OpenAI 的编程助手 Codex 现在支持使用任何开源模型，不仅限于 OpenAI 模型。用户可以通过 Codex App、CLI 和 SDK 配置第三方模型。这一更新使开发者能灵活选择推理后端，降低对 OpenAI 模型的依赖。目前已有多个开源模型可用于代码生成和解释。

AI产品 Codex OpenAI 编程助手开源模型 CLI/SDK

推荐理由：Codex 现在能用你喜欢的任何开源模型了，CLI、App、SDK 都支持，编程助手自由度更高。

原文

23:33

Thomas Wolf@Thom_Wolf

开发者 Tibo 在 X 平台分享指出，Codex App、CLI 和 SDK 均可配置使用任何开源模型，不再局限于 OpenAI 模型。配置方式详见 developers.openai.com/codex/config-a… 页面。这意味着用户可以在 Codex 中替换默认的 GPT 模型，选择 Llama、Mistral、DeepSeek 等开源替代方案。

技巧 Codex 开源模型 OpenAI 开发者工具

推荐理由：Codex 现在能跑开源模型了，不只是 OpenAI 的，快去试试把 Llama 或 Mistral 加进去

原文

13:43

orange.ai@oran_ge

精选76°

智谱 AI 今日正式开源 GLM 5.2 模型。该模型在编程 coding 能力上达到与 Claude 3 Opus 相当的水平，是首个实现这一成就的开源模型。GLM 5.2 已作为 beta 模型接入 Cola 平台供用户测试，定价与官方版本相同。

AI模型 GLM 5.2 智谱AI Cola 编程助手开源模型

推荐理由：智谱把编程能力比肩 Opus 的 GLM 5.2 开源了，还接入了 Cola 让大家免费试。

原文

12:40

orange.ai@oran_ge

GLM-5.2 由 Z.ai 发布，在编码和智能体任务上取得显著进步，首次让开源模型在 Coding 能力上达到 Opus 水平。模型支持 1M 上下文窗口，提供两种推理努力级别（max 和 high），权重采用 MIT 开源许可，API 定价与 GLM-5.1 相同。

AI模型 GLM-5.2 Z.ai 开源模型编码能力推理模型

推荐理由：Z.ai 开源了 GLM-5.2，编码水平追上 Opus，还给了 1M 上下文和两种推理模式，MIT 许可随便用。

原文

11:55

歸藏(guizang.ai)@op7418

74°

智谱 AI 正式发布并开源 GLM-5.2 模型。该模型支持 100 万 token 稳定上下文，并引入思考力度控制能力。架构上采用 IndexShare 机制，每四层稀疏注意力共享 indexer，在百万 token 下将每 token 计算量降低约 2.9 倍。基准测试成绩表现出色，定位处理长周期任务。

AI模型 GLM-5.2 智谱开源模型长上下文推理模型

推荐理由：智谱 GLM-5.2 开源了，百万上下文还能省 2.9 倍算力，做长任务的朋友可以上手试试。

原文

11:37

berryxia@berryxia

精选

开发者发布了一个开源的本地OCR工作台，基于PP-OCRv6模型，在Mac上利用CoreML加速。提供Tiny(1.5MB)、Small、Medium(34.5MB)三个模型，支持图片上传、批量处理和导出CSV/Markdown/Excel。完全本地运行，苹果硅芯片自动启用CoreML加速，Intel Mac和Linux可用CPU。还包含浏览器版Tiny模型和与OmniDocBench、Apple Vision对比的评测脚本，在弯曲表面、点阵字体等难例场景表现良好。

AI产品 PP-OCRv6 CoreML Mac OCR 开源模型

推荐理由：老哥把PP-OCRv6做成了Mac本地工具，一键切换模型大小，还能批量导出，离线用超方便。

原文

10:01

Fireworks AI@FireworksAI_HQ

Fireworks AI 推出 GLM-5P2 模型，强调基准测试仅是参考，真正的评估应基于实际代码库、提示词和延迟 SLO。该模型支持直接替换 OpenAI 或 Anthropic 兼容客户端（如 accounts/fireworks/models/glm-5p2），用户可在真实场景中测试。Fireworks AI 建议开发者下载模型并尝试在自有代码库上运行，以验证实际性能。推文附有详细博客链接（fireworks.ai/blog/glm-5p2）供进一步了解。

AI模型 Fireworks AI GLM-5P2 OpenAI Anthropic 开源模型

推荐理由：Fireworks AI 让你用 GLM-5P2 直接在代码库上跑分，别光看基准，试试自己的提示词和延迟

原文

08:45

berryxia@berryxia

GLM-5.2 以 MIT 协议免费开源，提供 1M 上下文窗口，重点强化了长程任务的 Agent 能力。在 Coding、Tool use、Reasoning 上相比 GLM-5.1 有明显进步，尤其在需要长时间规划和多步执行的场景。API 价格不变，同时支持 Max 和 High 两种推理模式。社区已在 DeepSWE 等基准上验证其实力，开发者可在本地运行长上下文 Agent。

AI模型 GLM-5.2 开源模型智能体编程助手长上下文

推荐理由：智谱开源了GLM-5.2，MIT协议、1M上下文，编程和Agent任务比上一代强不少，还能本地跑，别错过。

原文

08:16

宝玉@dotey

精选76°

NVIDIA GEAR 实验室联合 CMU、UC Berkeley 发布 ENPIRE 系统，让 AI 编程 agent 在真实物理世界中自主重置场景、判断成败、改进策略并迭代代码，无需人类干预。系统在 pin 脚插入、穿扎带、剪扎带、插 GPU 等高精度任务上达到 99% 成功率（pass@8 标准）。测试了 OpenAI Codex（搭配 GPT-5.5）、Anthropic Claude Code（搭配 Opus 4.7）和月之暗面 Kimi Code（搭配 Kimi K2.6）三个 agent。项目还发现物理 scaling law：8 台机器人并行探索比 1 台或 4 台的研究推进速度快得多。所有代码将开源。

AI模型 ENPIRE NVIDIA GEAR 机器人操控智能体开源模型

推荐理由：NVIDIA 和 CMU 搞了个能自己跑实验的机器人系统，AI agent 操控真实机器人干活，成功率99%，还开源了。

原文

05:29

ollama@ollama

GLM-5.2 在 Design Arena 上以 1360 Elo 获得第一名，超过此前领先的 Claude Fable 5。该模型开源权重，排名较此前上升 4 位，Elo 提升 27 分。这使其成为 Design Arena 代码类别历史上最高 Elo 之一。GLM-5.2 由 Zai_org 发布。

AI模型 GLM-5.2 Design Arena Zai_org 开源模型代码生成

推荐理由：GLM-5.2 在代码设计赛上跑了第一，1360 Elo，超过 Claude Fable 5，还开源了，值得试试。

原文

04:28

elvis@omarsar0

GLM-5.2 在 Design Arena 上跃居第一，Elo 评分达 1360，超越了此前不可用的 Claude Fable 5。该模型相比前代提升了 4 个名次和 27 个 Elo 分，创下 Design Arena 代码类别中最高 Elo 记录之一。模型以开放权重发布，由 @Zai_org 团队推出。

AI模型 GLM-5.2 Design Arena 开源模型设计能力

推荐理由：智谱的 GLM-5.2 刚把 Claude Fable 5 挤下 Design Arena 榜首，开放权重还能自己测，设计能力拉满。

原文

04:01

elvis@omarsar0

GLM 5.2 在 FrontierSWE 基准上排名第 3，得分仅次于 Fable 5 和 Opus 4.8，并超越 GPT-5.5。这是首个缩小 Anthropic/OpenAI 与其他提供商之间差距的模型，同时也是目前最强的开源权重模型。该成绩展示了开源模型在编码任务上的竞争力。

AI模型 GLM 5.2 FrontierSWE GPT-5.5 开源模型编码基准

推荐理由：GLM 5.2 在编码基准上干掉了 GPT-5.5，开源里最强，值得关注。

原文

04:01

elvis@omarsar0

72°

Z.ai 宣布推出 GLM-5.2 开源权重模型，MIT 许可发布。其在编码和智能体任务上有显著改进，支持 1M 上下文窗口。提供两种推理等级：GLM-5.2 (max) 和 GLM-5.2 (high)，后者在性能与 token 效率间取得平衡。API 定价与 GLM-5.1 相同，权重已上架 Hugging Face。

AI模型 GLM-5.2 Z.ai 开源模型编码智能体长上下文

推荐理由：Z.ai 发了 GLM-5.2，开源权重、MIT 许可，编码和智能体能力提升明显，还支持 1M 上下文，想玩前沿模型的可以试试。

原文

03:49

ollama@ollama

精选

Z.ai 发布 GLM-5.2，支持 1M token 上下文窗口，专为长程编码和智能体任务设计。提供两种推理模式：GLM-5.2 (max) 和 GLM-5.2 (high)，权重以 MIT 许可开源。现已通过 Ollama 云服务在美国 NVIDIA Blackwell GPU 上可用，API 定价与 GLM-5.1 相同。该模型声称是目前最强开源编码模型。

AI模型 GLM-5.2 Z.ai Ollama 开源模型长上下文

推荐理由：Z.ai 开源了 GLM-5.2，有 1M 上下文窗口，适合写长代码和搭智能体，在 Ollama 上直接就能用，MIT 许可随便玩。

原文

03:46

lmarena.ai@lmarena_ai

76°

GLM-5.2 (Max) 在 Code Arena: Frontend 中排名第二，得分比 Claude Opus 4.7 (Thinking) 高 29 分，仅次于 Fable 5。在 Agent Arena 中排名第 10，是排名最高的开源模型，超越 Kimi-K2.6 和 Minimax-M3。在 Brand & Marketing、Reference-Based Design 等 6 个子类别中均排名第一。价格维持 $1.4/$4.4 per input/output MTokens，上下文窗口 1M。与 5.1 相比，排名从 #13 升至 #10，任务成功率和用户评价提升，但 steerability 下降 6%。

AI模型 GLM-5.2 Zai_org Code Arena Agent Arena 开源模型

推荐理由：GLM-5.2 在编程和智能体任务上超越 Claude Opus 4.7，是开源模型新标杆，编程能力仅次于 Fable 5。

原文

03:38

@koltregaskes@koltregaskes

DeepSeek 4.1 版本预计于本周发布。该版本是 DeepSeek 系列的最新迭代，具体性能数据尚未公布。用户可关注官方渠道获取更新信息。

AI模型 DeepSeek DeepSeek 4.1 模型发布开源模型

推荐理由：DeepSeek 要发新版本了，听说这周就上线，看看有什么进步。

原文

03:37

The Rundown AI@therundownai

73°

Z AI发布了GLM-5.2，一款开源权重模型，支持1M token上下文窗口。在long-horizon coding基准上得分为74.4，超过GPT-5.5的72.6。在SWE-bench Pro上得分为62.1，同样领先GPT-5.5。AIME 2026数学测试得分为99.2，高于Opus 4.8和GPT-5.5。该模型在Designarena排名第一，并以MIT许可证发布。

AI模型 GLM-5.2 Z AI Opus 4.8 GPT-5.5 开源模型

推荐理由：Z AI的GLM-5.2开源，百万token上下文，数学和编程全面超过GPT-5.5，值得试玩。

原文

03:04

OpenRouter@OpenRouterAI

精选

Z.ai 发布 GLM-5.2 模型，采用 MIT 开源许可。该模型在编码和智能体任务上有显著提升，支持最长 1M 标记的上下文窗口。提供两种推理强度：GLM-5.2 (max) 追求极限性能，GLM-5.2 (high) 平衡性能与 token 效率。API 定价与 GLM-5.1 保持一致。

AI模型 GLM-5.2 Z.ai 开源模型编码助手智能体

推荐理由：Z.ai 新出的 GLM-5.2 模型，编码和智能体能力大幅增强，还有 1M 超大上下文，而且开源！API 价格没涨，值得试试。

原文

03:01

lmarena.ai@lmarena_ai

精选72°

GLM-5.2 (Max) 在 Agent Arena 排行榜上排名第10，得分接近 Claude-Opus-4.8（非推理模式）。它成为排名最高的开源模型，较去年发布的 GLM-5.1 从第13位上升3位。该模型在数百万真实长程任务上评测，可调用网页搜索、文件系统和终端工具。GLM-5.2 (Max) 输入/输出定价保持为每百万 token 1.4/4.4 美元，支持1M上下文窗口，权重采用 MIT 许可开源。

AI模型 GLM-5.2 Zai_org Agent Arena 开源模型智能体

推荐理由：Zai_org 发了 GLM-5.2，在 Agent 任务榜单上排第10，碾压所有开源模型，而且价格没变。跑复杂工作流、调工具效果明显进步。

原文

02:17

kimmonismus@kimmonismus

77°

GLM-5.2 以 MIT 许可证开源，权重开放。该模型支持 1M token 上下文窗口。提供 max 和 high 两种推理模式。专门针对大规模部署、自动化研究、性能优化和复杂调试进行训练。API 定价与 GLM-5.1 保持一致。

AI模型 GLM-5.2 智谱开源模型长上下文推理模型

推荐理由：智谱开源了 GLM-5.2，1M 上下文还能选推理模式，做长代码任务更强了。

原文

01:31

lmarena.ai@lmarena_ai

精选

MiniMax M3 在全新 Agent Arena 排行榜上位列第18，是排名第5的开源模型。相比 M2.7，M3 从第22名升至第18名，主要改进是任务成功确认和 bash 错误恢复能力。工具幻觉保持低位，与最佳模型并列第一。排行榜基于30万+任务、200万+工具调用和4000万行代码的代理会话评估。

AI模型 MiniMax M3 Agent Arena 开源模型智能体

推荐理由：MiniMax M3 在 Agent Arena 上排名上升了4位，是最强开源模型之一，能写代码、做PPT、查资料，幻觉控制也顶级。

原文

00:28

向阳乔木@vista8

Factory AI CEO在播客中表示，约80%到90%的任务可用开源模型完成，顶级模型更适合规划和决策。AI工具为高杠杆人员提供更高杠杆，而对低杠杆人员帮助有限。他认为未来最值钱的工程师是能端到端拥有业务结果的人，而非仅会写代码者。他还预测三年内Token支出中位数将与薪资处于同一数量级。

行业 Factory AI 开源模型 AI趋势 Token 工程师价值

推荐理由：Factory AI CEO聊了开源模型和顶级模型怎么分工，还有未来什么样的工程师最值钱，挺有启发。

原文

00:10

Justine Moore@venturetwins

Ideogram 发布了名为 Ideogram 2.0 的开源权重图像模型，宣称在开放权重类别中排名第一。该模型体积足够小，可在消费级 GPU 上运行，但在设计任务上与 Nano Banana 和 GPT Image 竞争。研究团队由 @mo_norouzi 领导，分享了技术细节和观点。

AI模型 Ideogram 开源模型图像生成消费级GPU GPT Image

推荐理由：Ideogram 这个开源权重图像模型能在普通显卡上跑，还能和 GPT Image 掰手腕，适合不想烧钱又想要好效果的人。

原文

6月16日

21:55

kimmonismus@kimmonismus

Axios报道，行业担忧白宫对Anthropic最新模型的出口管制将损害整个美国AI产业。德意志银行Jim Reid指出，无法依赖可能被关闭的技术。若企业担心OpenAI、Anthropic和Google的未来前沿模型被一夜限制，他们将加速转向多样化，这为开源模型带来重大优势。

行业 Anthropic 开源模型出口管制模型监管

推荐理由：美国政府对Anthropic下手的后果：企业开始转向开源模型，省得哪天被切断。

原文

14:22

AlphaSignal@AlphaSignalAI

精选

CUA-Gym是一个端到端流水线，通过三个协调编码智能体自动生成可验证的计算机使用任务。它构建了94个流行应用的模拟版本，包括Slack、Notion、Salesforce和Gmail克隆，并直接读取状态设计奖励函数。生成的训练数据集包含32,112个验证元组，覆盖110个环境。基于该数据训练的模型在OSWorld-Verified基准上达到72.6%，与Claude Sonnet 4.6持平。一个3B参数的小模型以十分之一参数匹配了17B基座模型的性能。

AI模型 CUA-Gym Claude Sonnet OSWorld-Verified 智能体开源模型

推荐理由：CUA-Gym用三个AI智能体自动生成训练数据，省去人工标注。它克隆了94个常用软件，训练出的模型追平了Claude Sonnet 4.6，小模型3B参数达到17B效果，还完全开源。

原文

14:05

berryxia@berryxia

78°

Unsloth团队用Dynamic 2-bit方案将1万亿参数的Kimi K2.7 Code模型压缩48%，重要层保留更高精度。量化后模型仅需325GB RAM/VRAM即可本地运行，推理速度达40+ tok/s。全精度版本需要610GB显存。该优化并非粗暴量化，而是保留了模型的推理效率，尤其适合长程任务、复杂推理和agent工作流。

AI模型 Kimi K2.7 Code Unsloth 量化本地部署开源模型

推荐理由：Unsloth把1万亿参数的Kimi K2.7 Code压到325GB本地能跑，速度40+ tok/s，长程推理和agent工作流全闭环，开源社区终于能自己跑了。

原文

09:32

lmarena.ai@lmarena_ai

精选

Kimi-K2.7-Code是Kimi新发布的编码模型，在Code Arena: Frontend中排名第3（开源模型），整体第19。相比K2.6，该模型在Kimi Code Bench v2上提升21.8%，Program Bench提升11.0%，MLS Bench Lite提升31.5%。推理效率提升，推理token使用量降低30%。模型已通过Kimi API和Kimi Code开源提供。

AI模型 Kimi-K2.7-Code Kimi Code Arena 开源模型编码模型

推荐理由：Kimi新出的编码模型K2.7-Code，在Code Arena前端排名第三，比上代提升明显，推理更省token，开源可玩。

原文

01:58

EleutherAI@AiEleuther

EleutherAI 启动 Summer of AI Research 2026 申请，活动周期为 7 月 13 日至 8 月 16 日。该项目为完全在线形式，面向研究经验较少的参与者。入选者将在资深研究员的指导下为开源 AI 研究项目做贡献。申请目前已开放。

行业 EleutherAI Summer of AI Research 2026 开源模型 AI研究开源项目

推荐理由：EleutherAI 搞了个暑期研究项目，没经验也能参加，导师带着你做开源AI，7月13号到8月16号，赶紧去申请看看。

原文

01:39

kimmonismus@kimmonismus

里约热内卢市政府IT公司发布了开源模型 Rio 3.5 Open 397B，参数量达 397B。该模型在多项基准测试中达到开源 SOTA，甚至超越此前领先的 Qwen 3.7。这一成果来自此前并不知名的团队，引发业界关注。

AI模型 Rio 3.5 Open 397B Qwen 3.7 开源模型

推荐理由：里约市政府搞了个 397B 的开源模型，居然跑赢了 Qwen 3.7，挺意外的，建议看看。

原文

6月15日

12:58

Cohere@cohere

Cohere 联合创始人 Nick Frosst 在 MTSlive 上警告，订阅专有 LLM 存在风险，强调技术应归用户所有。Cohere 随后发布了新模型 North Mini Code，旨在让用户拥有和控制模型。此模型针对代码任务优化，支持主权使用。

AI模型 Cohere North Mini Code 开源模型代码模型

推荐理由：Cohere 发了开源代码模型

原文