15:03小互@imxiaohuApodex 1.0 模型已正式发布,官方介绍页面提供了技术细节。在线体验平台 apodex.ai 可供用户直接试用。模型权重已在 Hugging Face 上开源下载。AI模型Apodex开源模型Hugging Face推荐理由:Apodex 发布了 1.0 版本,有在线体验和开源下载,感兴趣可以试试。原文
13:03@atomic_chat_hq@atomic_chat_hqAtomic Chat 正式在 Hugging Face 上线,成为该平台上的 Local App。用户可以直接在本地设备运行 Hugging Face 上的 200,000+ 个开放权重模型,所有处理都在设备端完成,保障隐私。该应用完全开源,无需联网即可使用多种模型。AI产品Atomic ChatHugging Face本地模型开源模型推荐理由:Atomic Chat 现在能在本地跑 Hugging Face 上 20 多万个模型,完全离线私密,还开源,搞 AI 的可以试试看。原文
10:57Viking@vikingmuteGLM5.2在Artificial Analysis开源模型排名中登顶,多项benchmark评分领先。有用户反馈其实际体验接近Opus 4.6,作者考虑将Deepseek V4 Pro替换为GLM5.2。该帖子获得2条回复、505次浏览。AI模型GLM5.2Artificial AnalysisOpus 4.6Deepseek V4 Pro开源模型2 个信源在谈推荐理由:GLM5.2在开源模型排名拿了第一,而且有人说用起来感觉像Opus 4.6,你要是想换掉Deepseek V4 Pro可以试试。原文
05:29ollama@ollama用户称 GLM 5.2 达到 SOTA 级别的智能,但成本仅为同类模型的一小部分。他认为 GLM 5.2 的输出和个性优于 GPT 5.5。他计划将 GLM 5.2 用于自己的工具 Hermes 以及客户项目中。该推文获得 170 点赞和超 7300 次浏览。AI模型GLM 5.2GPT 5.5Hermes开源模型推荐理由:有人实测后说 GLM 5.2 比 GPT 5.5 更强还便宜,准备放进自己产品用,有参考价值。原文
04:56elvis@omarsar0GLM-5.2 在 Design Arena 设计基准上以 Elo 1360 分排名第一,超越此前第一的 Claude Fable 5。该模型擅长生成游戏、落地页、HTML 组件和 3D 世界等内容。Zai 组织发布了这个开源权重模型,其设计质量被认为接近 Opus 级别。评测显示它相比此前版本提升了 4 个名次和 27 个 Elo 点。AI模型GLM-5.2ZaiDesign Arena设计生成开源模型2 个信源在谈推荐理由:Zai 开源的 GLM-5.2 在 Design Arena 上干掉了 Claude Fable 5,能设计游戏、HTML 和 3D 世界,不看后悔。原文
04:01lmarena.ai@lmarena_aiAgent Arena排行榜已上线,用于评估不同AI智能体的表现。该排行榜支持用户按开源模型或实验室筛选查看结果。用户可通过链接 arena.ai/leaderboard/ag… 直接访问。AI模型Agent Arena智能体开源模型实验室推荐理由:想对比开源智能体的表现?Agent Arena新排行榜支持按模型或实验室筛选,一目了然。原文
03:55LangChain@LangChainAILangChain测试显示,Alibaba Qwen基础模型配合良好提示在感知错误分类任务上性能接近前沿模型。使用LoRA SFT微调后,模型性能接近或超过前沿模型。实验表明微调能使开源模型与顶级闭源模型竞争。AI模型QwenAlibabaLoRA微调开源模型推荐理由:LangChain实测:Qwen基础版+好提示就能追平顶级模型,微调后甚至超越。开源模型潜力很大!原文
03:33lmarena.ai@lmarena_ai精选Kimi K2.7 Code 在 Agent Arena 排行榜上总体排名第19,在开源模型中排第6。该模型在 Kimi Code Bench v2 上比 K2.6 提升21.8%,在 Program Bench 上提升11.0%,在 MLS Bench Lite 上提升31.5%。推理 token 使用量降低30%,减少了过度思考。长程编码任务指令遵循和完成率均有提升。目前通过 Kimi API 和 Kimi Code 可用。AI模型Kimi-K2.7-CodeKimi_Moonshot开源模型编程助手推理模型6 个信源在谈推荐理由:Kimi 发了新编程模型 K2.7 Code,推理更省 token,基准提升明显,而且在 Agent Arena 上开源模型里排第6,值得一试。原文
03:30ollama@ollama精选Ollama 宣布用户可以在 Codex App、CLI 和 SDK 中使用 GLM-5.2 和 Kimi-K2.7-Code 模型。此前 Codex 仅支持 OpenAI 模型,现在扩展至开源模型。使用命令 ollama launch codex 即可启用。这一集成让开发者能用更多模型进行代码生成。AI产品OllamaCodexGLM-5.2Kimi-K2.7-Code开源模型10 个信源在谈推荐理由:Ollama 把 GLM-5.2 和 Kimi-K2.7-Code 也带进 Codex 了,以前只能用 OpenAI 模型,现在敲一行命令就能切换试试。原文
23:48小互@imxiaohu71°OpenAI 宣布 Codex 产品,包含 App 客户端、命令行 CLI 和 SDK,允许开发者自由接入任何开源大模型,不强制绑定 OpenAI 自家模型。官方同时发布了手把手配置文档,指导如何将 Codex 底层模型替换为免费开源模型。这一举措为开发者提供了更多选择,降低了对 OpenAI 模型的依赖。AI产品OpenAICodex开源模型开发工具CLI10 个信源在谈推荐理由:OpenAI 的 Codex 现在能接 DeepSeek 这类开源模型了,开发者可以自己换底层 AI,不用非得用 OpenAI 的。原文
23:40Geek@geekbbOpenAI 的编程助手 Codex 现在支持使用任何开源模型,不仅限于 OpenAI 模型。用户可以通过 Codex App、CLI 和 SDK 配置第三方模型。这一更新使开发者能灵活选择推理后端,降低对 OpenAI 模型的依赖。目前已有多个开源模型可用于代码生成和解释。AI产品CodexOpenAI编程助手开源模型CLI/SDK10 个信源在谈推荐理由:Codex 现在能用你喜欢的任何开源模型了,CLI、App、SDK 都支持,编程助手自由度更高。原文
23:33Thomas Wolf@Thom_Wolf开发者 Tibo 在 X 平台分享指出,Codex App、CLI 和 SDK 均可配置使用任何开源模型,不再局限于 OpenAI 模型。配置方式详见 developers.openai.com/codex/config-a… 页面。这意味着用户可以在 Codex 中替换默认的 GPT 模型,选择 Llama、Mistral、DeepSeek 等开源替代方案。技巧Codex开源模型OpenAI开发者工具10 个信源在谈推荐理由:Codex 现在能跑开源模型了,不只是 OpenAI 的,快去试试把 Llama 或 Mistral 加进去原文
13:43orange.ai@oran_ge精选76°智谱 AI 今日正式开源 GLM 5.2 模型。该模型在编程 coding 能力上达到与 Claude 3 Opus 相当的水平,是首个实现这一成就的开源模型。GLM 5.2 已作为 beta 模型接入 Cola 平台供用户测试,定价与官方版本相同。AI模型GLM 5.2智谱AICola编程助手开源模型1 个信源在谈推荐理由:智谱把编程能力比肩 Opus 的 GLM 5.2 开源了,还接入了 Cola 让大家免费试。原文
12:40orange.ai@oran_geGLM-5.2 由 Z.ai 发布,在编码和智能体任务上取得显著进步,首次让开源模型在 Coding 能力上达到 Opus 水平。模型支持 1M 上下文窗口,提供两种推理努力级别(max 和 high),权重采用 MIT 开源许可,API 定价与 GLM-5.1 相同。AI模型GLM-5.2Z.ai开源模型编码能力推理模型推荐理由:Z.ai 开源了 GLM-5.2,编码水平追上 Opus,还给了 1M 上下文和两种推理模式,MIT 许可随便用。原文
11:55歸藏(guizang.ai)@op741874°智谱 AI 正式发布并开源 GLM-5.2 模型。该模型支持 100 万 token 稳定上下文,并引入思考力度控制能力。架构上采用 IndexShare 机制,每四层稀疏注意力共享 indexer,在百万 token 下将每 token 计算量降低约 2.9 倍。基准测试成绩表现出色,定位处理长周期任务。AI模型GLM-5.2智谱开源模型长上下文推理模型推荐理由:智谱 GLM-5.2 开源了,百万上下文还能省 2.9 倍算力,做长任务的朋友可以上手试试。原文
11:37berryxia@berryxia精选开发者发布了一个开源的本地OCR工作台,基于PP-OCRv6模型,在Mac上利用CoreML加速。提供Tiny(1.5MB)、Small、Medium(34.5MB)三个模型,支持图片上传、批量处理和导出CSV/Markdown/Excel。完全本地运行,苹果硅芯片自动启用CoreML加速,Intel Mac和Linux可用CPU。还包含浏览器版Tiny模型和与OmniDocBench、Apple Vision对比的评测脚本,在弯曲表面、点阵字体等难例场景表现良好。AI产品PP-OCRv6CoreMLMacOCR开源模型推荐理由:老哥把PP-OCRv6做成了Mac本地工具,一键切换模型大小,还能批量导出,离线用超方便。原文
10:01Fireworks AI@FireworksAI_HQFireworks AI 推出 GLM-5P2 模型,强调基准测试仅是参考,真正的评估应基于实际代码库、提示词和延迟 SLO。该模型支持直接替换 OpenAI 或 Anthropic 兼容客户端(如 accounts/fireworks/models/glm-5p2),用户可在真实场景中测试。Fireworks AI 建议开发者下载模型并尝试在自有代码库上运行,以验证实际性能。推文附有详细博客链接(fireworks.ai/blog/glm-5p2)供进一步了解。AI模型Fireworks AIGLM-5P2OpenAIAnthropic开源模型10 个信源在谈推荐理由:Fireworks AI 让你用 GLM-5P2 直接在代码库上跑分,别光看基准,试试自己的提示词和延迟原文
08:45berryxia@berryxiaGLM-5.2 以 MIT 协议免费开源,提供 1M 上下文窗口,重点强化了长程任务的 Agent 能力。在 Coding、Tool use、Reasoning 上相比 GLM-5.1 有明显进步,尤其在需要长时间规划和多步执行的场景。API 价格不变,同时支持 Max 和 High 两种推理模式。社区已在 DeepSWE 等基准上验证其实力,开发者可在本地运行长上下文 Agent。AI模型GLM-5.2开源模型智能体编程助手长上下文推荐理由:智谱开源了GLM-5.2,MIT协议、1M上下文,编程和Agent任务比上一代强不少,还能本地跑,别错过。原文
08:16宝玉@dotey精选76°NVIDIA GEAR 实验室联合 CMU、UC Berkeley 发布 ENPIRE 系统,让 AI 编程 agent 在真实物理世界中自主重置场景、判断成败、改进策略并迭代代码,无需人类干预。系统在 pin 脚插入、穿扎带、剪扎带、插 GPU 等高精度任务上达到 99% 成功率(pass@8 标准)。测试了 OpenAI Codex(搭配 GPT-5.5)、Anthropic Claude Code(搭配 Opus 4.7)和月之暗面 Kimi Code(搭配 Kimi K2.6)三个 agent。项目还发现物理 scaling law:8 台机器人并行探索比 1 台或 4 台的研究推进速度快得多。所有代码将开源。AI模型ENPIRENVIDIA GEAR机器人操控智能体开源模型10 个信源在谈推荐理由:NVIDIA 和 CMU 搞了个能自己跑实验的机器人系统,AI agent 操控真实机器人干活,成功率99%,还开源了。原文
05:29ollama@ollamaGLM-5.2 在 Design Arena 上以 1360 Elo 获得第一名,超过此前领先的 Claude Fable 5。该模型开源权重,排名较此前上升 4 位,Elo 提升 27 分。这使其成为 Design Arena 代码类别历史上最高 Elo 之一。GLM-5.2 由 Zai_org 发布。AI模型GLM-5.2Design ArenaZai_org开源模型代码生成3 个信源在谈推荐理由:GLM-5.2 在代码设计赛上跑了第一,1360 Elo,超过 Claude Fable 5,还开源了,值得试试。原文
04:28elvis@omarsar0GLM-5.2 在 Design Arena 上跃居第一,Elo 评分达 1360,超越了此前不可用的 Claude Fable 5。该模型相比前代提升了 4 个名次和 27 个 Elo 分,创下 Design Arena 代码类别中最高 Elo 记录之一。模型以开放权重发布,由 @Zai_org 团队推出。AI模型GLM-5.2Design Arena开源模型设计能力2 个信源在谈推荐理由:智谱的 GLM-5.2 刚把 Claude Fable 5 挤下 Design Arena 榜首,开放权重还能自己测,设计能力拉满。原文
04:01elvis@omarsar0GLM 5.2 在 FrontierSWE 基准上排名第 3,得分仅次于 Fable 5 和 Opus 4.8,并超越 GPT-5.5。这是首个缩小 Anthropic/OpenAI 与其他提供商之间差距的模型,同时也是目前最强的开源权重模型。该成绩展示了开源模型在编码任务上的竞争力。AI模型GLM 5.2FrontierSWEGPT-5.5开源模型编码基准10 个信源在谈推荐理由:GLM 5.2 在编码基准上干掉了 GPT-5.5,开源里最强,值得关注。原文
04:01elvis@omarsar072°Z.ai 宣布推出 GLM-5.2 开源权重模型,MIT 许可发布。其在编码和智能体任务上有显著改进,支持 1M 上下文窗口。提供两种推理等级:GLM-5.2 (max) 和 GLM-5.2 (high),后者在性能与 token 效率间取得平衡。API 定价与 GLM-5.1 相同,权重已上架 Hugging Face。AI模型GLM-5.2Z.ai开源模型编码智能体长上下文推荐理由:Z.ai 发了 GLM-5.2,开源权重、MIT 许可,编码和智能体能力提升明显,还支持 1M 上下文,想玩前沿模型的可以试试。原文
03:49ollama@ollama精选Z.ai 发布 GLM-5.2,支持 1M token 上下文窗口,专为长程编码和智能体任务设计。提供两种推理模式:GLM-5.2 (max) 和 GLM-5.2 (high),权重以 MIT 许可开源。现已通过 Ollama 云服务在美国 NVIDIA Blackwell GPU 上可用,API 定价与 GLM-5.1 相同。该模型声称是目前最强开源编码模型。AI模型GLM-5.2Z.aiOllama开源模型长上下文10 个信源在谈推荐理由:Z.ai 开源了 GLM-5.2,有 1M 上下文窗口,适合写长代码和搭智能体,在 Ollama 上直接就能用,MIT 许可随便玩。原文
03:46lmarena.ai@lmarena_ai76°GLM-5.2 (Max) 在 Code Arena: Frontend 中排名第二,得分比 Claude Opus 4.7 (Thinking) 高 29 分,仅次于 Fable 5。在 Agent Arena 中排名第 10,是排名最高的开源模型,超越 Kimi-K2.6 和 Minimax-M3。在 Brand & Marketing、Reference-Based Design 等 6 个子类别中均排名第一。价格维持 $1.4/$4.4 per input/output MTokens,上下文窗口 1M。与 5.1 相比,排名从 #13 升至 #10,任务成功率和用户评价提升,但 steerability 下降 6%。AI模型GLM-5.2Zai_orgCode ArenaAgent Arena开源模型3 个信源在谈推荐理由:GLM-5.2 在编程和智能体任务上超越 Claude Opus 4.7,是开源模型新标杆,编程能力仅次于 Fable 5。原文
03:38@koltregaskes@koltregaskesDeepSeek 4.1 版本预计于本周发布。该版本是 DeepSeek 系列的最新迭代,具体性能数据尚未公布。用户可关注官方渠道获取更新信息。AI模型DeepSeekDeepSeek 4.1模型发布开源模型推荐理由:DeepSeek 要发新版本了,听说这周就上线,看看有什么进步。原文
03:37The Rundown AI@therundownai73°Z AI发布了GLM-5.2,一款开源权重模型,支持1M token上下文窗口。在long-horizon coding基准上得分为74.4,超过GPT-5.5的72.6。在SWE-bench Pro上得分为62.1,同样领先GPT-5.5。AIME 2026数学测试得分为99.2,高于Opus 4.8和GPT-5.5。该模型在Designarena排名第一,并以MIT许可证发布。AI模型GLM-5.2Z AIOpus 4.8GPT-5.5开源模型6 个信源在谈推荐理由:Z AI的GLM-5.2开源,百万token上下文,数学和编程全面超过GPT-5.5,值得试玩。原文
03:04OpenRouter@OpenRouterAI精选Z.ai 发布 GLM-5.2 模型,采用 MIT 开源许可。该模型在编码和智能体任务上有显著提升,支持最长 1M 标记的上下文窗口。提供两种推理强度:GLM-5.2 (max) 追求极限性能,GLM-5.2 (high) 平衡性能与 token 效率。API 定价与 GLM-5.1 保持一致。AI模型GLM-5.2Z.ai开源模型编码助手智能体推荐理由:Z.ai 新出的 GLM-5.2 模型,编码和智能体能力大幅增强,还有 1M 超大上下文,而且开源!API 价格没涨,值得试试。原文
03:01lmarena.ai@lmarena_ai精选72°GLM-5.2 (Max) 在 Agent Arena 排行榜上排名第10,得分接近 Claude-Opus-4.8(非推理模式)。它成为排名最高的开源模型,较去年发布的 GLM-5.1 从第13位上升3位。该模型在数百万真实长程任务上评测,可调用网页搜索、文件系统和终端工具。GLM-5.2 (Max) 输入/输出定价保持为每百万 token 1.4/4.4 美元,支持1M上下文窗口,权重采用 MIT 许可开源。AI模型GLM-5.2Zai_orgAgent Arena开源模型智能体推荐理由:Zai_org 发了 GLM-5.2,在 Agent 任务榜单上排第10,碾压所有开源模型,而且价格没变。跑复杂工作流、调工具效果明显进步。原文
02:17kimmonismus@kimmonismus77°GLM-5.2 以 MIT 许可证开源,权重开放。该模型支持 1M token 上下文窗口。提供 max 和 high 两种推理模式。专门针对大规模部署、自动化研究、性能优化和复杂调试进行训练。API 定价与 GLM-5.1 保持一致。AI模型GLM-5.2智谱开源模型长上下文推理模型推荐理由:智谱开源了 GLM-5.2,1M 上下文还能选推理模式,做长代码任务更强了。原文
01:31lmarena.ai@lmarena_ai精选MiniMax M3 在全新 Agent Arena 排行榜上位列第18,是排名第5的开源模型。相比 M2.7,M3 从第22名升至第18名,主要改进是任务成功确认和 bash 错误恢复能力。工具幻觉保持低位,与最佳模型并列第一。排行榜基于30万+任务、200万+工具调用和4000万行代码的代理会话评估。AI模型MiniMaxM3Agent Arena开源模型智能体推荐理由:MiniMax M3 在 Agent Arena 上排名上升了4位,是最强开源模型之一,能写代码、做PPT、查资料,幻觉控制也顶级。原文
00:28向阳乔木@vista8Factory AI CEO在播客中表示,约80%到90%的任务可用开源模型完成,顶级模型更适合规划和决策。AI工具为高杠杆人员提供更高杠杆,而对低杠杆人员帮助有限。他认为未来最值钱的工程师是能端到端拥有业务结果的人,而非仅会写代码者。他还预测三年内Token支出中位数将与薪资处于同一数量级。行业Factory AI开源模型AI趋势Token工程师价值推荐理由:Factory AI CEO聊了开源模型和顶级模型怎么分工,还有未来什么样的工程师最值钱,挺有启发。原文
00:10Justine Moore@venturetwinsIdeogram 发布了名为 Ideogram 2.0 的开源权重图像模型,宣称在开放权重类别中排名第一。该模型体积足够小,可在消费级 GPU 上运行,但在设计任务上与 Nano Banana 和 GPT Image 竞争。研究团队由 @mo_norouzi 领导,分享了技术细节和观点。AI模型Ideogram开源模型图像生成消费级GPUGPT Image推荐理由:Ideogram 这个开源权重图像模型能在普通显卡上跑,还能和 GPT Image 掰手腕,适合不想烧钱又想要好效果的人。原文
21:55kimmonismus@kimmonismusAxios报道,行业担忧白宫对Anthropic最新模型的出口管制将损害整个美国AI产业。德意志银行Jim Reid指出,无法依赖可能被关闭的技术。若企业担心OpenAI、Anthropic和Google的未来前沿模型被一夜限制,他们将加速转向多样化,这为开源模型带来重大优势。行业Anthropic开源模型出口管制模型监管10 个信源在谈推荐理由:美国政府对Anthropic下手的后果:企业开始转向开源模型,省得哪天被切断。原文
14:22AlphaSignal@AlphaSignalAI精选CUA-Gym是一个端到端流水线,通过三个协调编码智能体自动生成可验证的计算机使用任务。它构建了94个流行应用的模拟版本,包括Slack、Notion、Salesforce和Gmail克隆,并直接读取状态设计奖励函数。生成的训练数据集包含32,112个验证元组,覆盖110个环境。基于该数据训练的模型在OSWorld-Verified基准上达到72.6%,与Claude Sonnet 4.6持平。一个3B参数的小模型以十分之一参数匹配了17B基座模型的性能。AI模型CUA-GymClaude SonnetOSWorld-Verified智能体开源模型5 个信源在谈推荐理由:CUA-Gym用三个AI智能体自动生成训练数据,省去人工标注。它克隆了94个常用软件,训练出的模型追平了Claude Sonnet 4.6,小模型3B参数达到17B效果,还完全开源。原文
14:05berryxia@berryxia78°Unsloth团队用Dynamic 2-bit方案将1万亿参数的Kimi K2.7 Code模型压缩48%,重要层保留更高精度。量化后模型仅需325GB RAM/VRAM即可本地运行,推理速度达40+ tok/s。全精度版本需要610GB显存。该优化并非粗暴量化,而是保留了模型的推理效率,尤其适合长程任务、复杂推理和agent工作流。AI模型Kimi K2.7 CodeUnsloth量化本地部署开源模型4 个信源在谈推荐理由:Unsloth把1万亿参数的Kimi K2.7 Code压到325GB本地能跑,速度40+ tok/s,长程推理和agent工作流全闭环,开源社区终于能自己跑了。原文
09:32lmarena.ai@lmarena_ai精选Kimi-K2.7-Code是Kimi新发布的编码模型,在Code Arena: Frontend中排名第3(开源模型),整体第19。相比K2.6,该模型在Kimi Code Bench v2上提升21.8%,Program Bench提升11.0%,MLS Bench Lite提升31.5%。推理效率提升,推理token使用量降低30%。模型已通过Kimi API和Kimi Code开源提供。AI模型Kimi-K2.7-CodeKimiCode Arena开源模型编码模型3 个信源在谈推荐理由:Kimi新出的编码模型K2.7-Code,在Code Arena前端排名第三,比上代提升明显,推理更省token,开源可玩。原文
01:58EleutherAI@AiEleutherEleutherAI 启动 Summer of AI Research 2026 申请,活动周期为 7 月 13 日至 8 月 16 日。该项目为完全在线形式,面向研究经验较少的参与者。入选者将在资深研究员的指导下为开源 AI 研究项目做贡献。申请目前已开放。行业EleutherAISummer of AI Research 2026开源模型AI研究开源项目推荐理由:EleutherAI 搞了个暑期研究项目,没经验也能参加,导师带着你做开源AI,7月13号到8月16号,赶紧去申请看看。原文
01:39kimmonismus@kimmonismus里约热内卢市政府IT公司发布了开源模型 Rio 3.5 Open 397B,参数量达 397B。该模型在多项基准测试中达到开源 SOTA,甚至超越此前领先的 Qwen 3.7。这一成果来自此前并不知名的团队,引发业界关注。AI模型Rio 3.5 Open 397BQwen 3.7开源模型1 个信源在谈推荐理由:里约市政府搞了个 397B 的开源模型,居然跑赢了 Qwen 3.7,挺意外的,建议看看。原文
12:58Cohere@cohereCohere 联合创始人 Nick Frosst 在 MTSlive 上警告,订阅专有 LLM 存在风险,强调技术应归用户所有。Cohere 随后发布了新模型 North Mini Code,旨在让用户拥有和控制模型。此模型针对代码任务优化,支持主权使用。AI模型CohereNorth Mini Code开源模型代码模型推荐理由:Cohere 发了开源代码模型原文