18:24shao__meng@shao__meng推特用户发起国产四个LLM的投票,GLM-5.2以79.7%得票率大幅领先。DeepSeek V4获13.4%,Kimi K2.7为5.2%,MiniMax M3仅1.7%。发起者认为GLM-5.2表现强劲而MiniMax M3得票惨淡。帖子还对比了Gemini 3.5 Flash,认为其性能不佳导致结果明显。行业GLM-5.2DeepSeek V4Kimi K2.7MiniMax M3国产模型推荐理由:看看社区投票,GLM-5.2碾压式领先,想知道国产模型谁更受认可?结果挺有意思。原文
16:18Pandaily@contact@pandaily.com (Pandaily)美国政府对 Anthropic 的 Claude Fable 5 发出出口管制令,非美国用户被限制访问。这一举措标志着 AI 出口管制进入新阶段,强化了中国发展自主研发 AI 模型的战略必要性。Claude Fable 5 是 Anthropic 于 2025 年发布的最新旗舰模型,此前已引发安全争议。中国国产模型如 DeepSeek、通义千问等被视为替代选择。分析师指出,依赖国外模型存在被切断服务的风险,国产 AI 是保障数据安全与自主可控的关键。行业Claude Fable 5Anthropic出口管制国产模型AI安全10 个信源在谈推荐理由:美国突然封锁 Claude Fable 5 对非美国用户,国产模型又成了唯一靠谱的选择。看看这事背后的出口管制新规,就知道为什么中国必须有自己的大模型了。原文
00:40orange.ai@oran_ge用户实测显示,智谱的 glm 5.2 模型在 COLA 基准上表现优于 deepseek 和 mimo,在智商和情商方面都有提升。该模型被评价为国产模型的新高度,但当前版本存在稳定性差和响应缓慢的问题。测试结果基于真实用户反馈,尚未有官方基准数据佐证。AI模型glm 5.2deepseekmimo推理模型国产模型推荐理由:如果你在找国产模型,glm 5.2 在 COLA 上比 deepseek 和 mimo 强,但别着急用,现在慢还不稳定。原文
00:36量子位@一水某国产模型在多项关键医疗测评中超过GPT-5.5。这些测评覆盖多个专科方向,准确率指标领先。这表明国产医疗AI在核心性能上已实现突破。AI模型GPT-5.5医疗AI基准测试国产模型推荐理由:国产医疗AI终于打败GPT-5.5了,评测成绩很能打,值得关心AI落地的人看一看。原文
00:35Geek@geekbb从2022年期待本地运行ChatGPT-3.5,到2026年DeepSeek、Qwen、GLM、Kimi每月发布旗舰模型。本地部署模型列表包括GLM-4、DeepSeek R1/V3、Qwen3、Kimi-K2、GPT-oss-120b、Qwen3.7-Plus、Kimi-K2.7、Deepseek-V4、GLM-5.2等九个版本。迭代速度远超预期,社区感叹没有尽头。行业DeepSeekQwenGLMKimi国产模型推荐理由:这帖子把2022到2026国产模型进化史盘得清清楚楚,DeepSeek、Qwen、GLM、Kimi每月一个旗舰,本地部署清单都快十个版本了,AI发烧友必看。原文
19:26Skywork@Skywork_aiSkywork AI 宣布其 SkyClaw-v1.0 模型自上线以来访问量激增,导致服务拥堵。为保障整体服务稳定,平台临时实施限流措施。但 Skywork Agent 上的 SkyClaw-v1.0 使用不受影响。团队感谢用户理解与支持。AI产品SkyClaw-v1.0Skywork AI限流API国产模型推荐理由:SkyClaw-v1.0 的火爆说明其能力受认可,但限流可能影响直接 API 调用者。如果你在用 Skywork Agent 或关注国产模型进展,这条值得留意——Agent 端仍可正常使用。原文
19:05岚叔@lufzzliz83°阿里通义千问发布 Qwen3.7-Max,在第三方 Arena 全球大模型盲测总榜中超越 Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,位列国产第一,与 GPT、Claude、Gemini 最强模型接近。在编程智能体方面,SWE-Pro、SWE-Multilingual 等测评领先,Terminal Bench 2.0 得分 69.7。通用智能体能力显著提升,在 MCP-Atlas、MCP-Mark 等现实测试中创国产新高。新增 preserve_thinking 参数,保留前序思维内容以增强 Agent 决策一致性,减少重复推理 Token 消耗,默认关闭。实测在 Claude Code 下跨框架泛化能力不错,但需要更精准的提示词和多轮迭代。AI模型Qwen3.7-Max国产模型编程智能体AgentMCP/工具2 个信源在谈推荐理由:Qwen3.7-Max 在多项基准上追平国际顶尖模型,做 Agent 和编程自动化的开发者可以直接拿来替代闭源方案,尤其是 preserve_thinking 参数对长周期任务很有用,值得一试。原文