18:24shao__meng@shao__meng推特用户发起国产四个LLM的投票,GLM-5.2以79.7%得票率大幅领先。DeepSeek V4获13.4%,Kimi K2.7为5.2%,MiniMax M3仅1.7%。发起者认为GLM-5.2表现强劲而MiniMax M3得票惨淡。帖子还对比了Gemini 3.5 Flash,认为其性能不佳导致结果明显。行业GLM-5.2DeepSeek V4Kimi K2.7MiniMax M3国产模型推荐理由:看看社区投票,GLM-5.2碾压式领先,想知道国产模型谁更受认可?结果挺有意思。原文
00:40orange.ai@oran_ge用户实测显示,智谱的 glm 5.2 模型在 COLA 基准上表现优于 deepseek 和 mimo,在智商和情商方面都有提升。该模型被评价为国产模型的新高度,但当前版本存在稳定性差和响应缓慢的问题。测试结果基于真实用户反馈,尚未有官方基准数据佐证。AI模型glm 5.2deepseekmimo推理模型国产模型推荐理由:如果你在找国产模型,glm 5.2 在 COLA 上比 deepseek 和 mimo 强,但别着急用,现在慢还不稳定。原文
00:35Geek@geekbb从2022年期待本地运行ChatGPT-3.5,到2026年DeepSeek、Qwen、GLM、Kimi每月发布旗舰模型。本地部署模型列表包括GLM-4、DeepSeek R1/V3、Qwen3、Kimi-K2、GPT-oss-120b、Qwen3.7-Plus、Kimi-K2.7、Deepseek-V4、GLM-5.2等九个版本。迭代速度远超预期,社区感叹没有尽头。行业DeepSeekQwenGLMKimi国产模型推荐理由:这帖子把2022到2026国产模型进化史盘得清清楚楚,DeepSeek、Qwen、GLM、Kimi每月一个旗舰,本地部署清单都快十个版本了,AI发烧友必看。原文
19:26Skywork@Skywork_aiSkywork AI 宣布其 SkyClaw-v1.0 模型自上线以来访问量激增,导致服务拥堵。为保障整体服务稳定,平台临时实施限流措施。但 Skywork Agent 上的 SkyClaw-v1.0 使用不受影响。团队感谢用户理解与支持。AI产品SkyClaw-v1.0Skywork AI限流API国产模型推荐理由:SkyClaw-v1.0 的火爆说明其能力受认可,但限流可能影响直接 API 调用者。如果你在用 Skywork Agent 或关注国产模型进展,这条值得留意——Agent 端仍可正常使用。原文
19:05岚叔@lufzzliz83°阿里通义千问发布 Qwen3.7-Max,在第三方 Arena 全球大模型盲测总榜中超越 Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,位列国产第一,与 GPT、Claude、Gemini 最强模型接近。在编程智能体方面,SWE-Pro、SWE-Multilingual 等测评领先,Terminal Bench 2.0 得分 69.7。通用智能体能力显著提升,在 MCP-Atlas、MCP-Mark 等现实测试中创国产新高。新增 preserve_thinking 参数,保留前序思维内容以增强 Agent 决策一致性,减少重复推理 Token 消耗,默认关闭。实测在 Claude Code 下跨框架泛化能力不错,但需要更精准的提示词和多轮迭代。AI模型Qwen3.7-Max国产模型编程智能体AgentMCP/工具2 个信源在谈推荐理由:Qwen3.7-Max 在多项基准上追平国际顶尖模型,做 Agent 和编程自动化的开发者可以直接拿来替代闭源方案,尤其是 preserve_thinking 参数对长周期任务很有用,值得一试。原文