全部 AI 动态 · AI 热点

6月22日

18:24

shao__meng@shao__meng

推特用户发起国产四个LLM的投票，GLM-5.2以79.7%得票率大幅领先。DeepSeek V4获13.4%，Kimi K2.7为5.2%，MiniMax M3仅1.7%。发起者认为GLM-5.2表现强劲而MiniMax M3得票惨淡。帖子还对比了Gemini 3.5 Flash，认为其性能不佳导致结果明显。

行业 GLM-5.2 DeepSeek V4 Kimi K2.7 MiniMax M3 国产模型

推荐理由：看看社区投票，GLM-5.2碾压式领先，想知道国产模型谁更受认可？结果挺有意思。

原文

6月18日

00:40

orange.ai@oran_ge

用户实测显示，智谱的 glm 5.2 模型在 COLA 基准上表现优于 deepseek 和 mimo，在智商和情商方面都有提升。该模型被评价为国产模型的新高度，但当前版本存在稳定性差和响应缓慢的问题。测试结果基于真实用户反馈，尚未有官方基准数据佐证。

AI模型 glm 5.2 deepseek mimo 推理模型国产模型

推荐理由：如果你在找国产模型，glm 5.2 在 COLA 上比 deepseek 和 mimo 强，但别着急用，现在慢还不稳定。

原文

00:35

Geek@geekbb

从2022年期待本地运行ChatGPT-3.5，到2026年DeepSeek、Qwen、GLM、Kimi每月发布旗舰模型。本地部署模型列表包括GLM-4、DeepSeek R1/V3、Qwen3、Kimi-K2、GPT-oss-120b、Qwen3.7-Plus、Kimi-K2.7、Deepseek-V4、GLM-5.2等九个版本。迭代速度远超预期，社区感叹没有尽头。

行业 DeepSeek Qwen GLM Kimi 国产模型

推荐理由：这帖子把2022到2026国产模型进化史盘得清清楚楚，DeepSeek、Qwen、GLM、Kimi每月一个旗舰，本地部署清单都快十个版本了，AI发烧友必看。

原文

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月27日

19:26

Skywork@Skywork_ai

Skywork AI 宣布其 SkyClaw-v1.0 模型自上线以来访问量激增，导致服务拥堵。为保障整体服务稳定，平台临时实施限流措施。但 Skywork Agent 上的 SkyClaw-v1.0 使用不受影响。团队感谢用户理解与支持。

AI产品 SkyClaw-v1.0 Skywork AI 限流 API 国产模型

推荐理由：SkyClaw-v1.0 的火爆说明其能力受认可，但限流可能影响直接 API 调用者。如果你在用 Skywork Agent 或关注国产模型进展，这条值得留意——Agent 端仍可正常使用。

原文

5月22日

19:05

岚叔@lufzzliz

83°

阿里通义千问发布 Qwen3.7-Max，在第三方 Arena 全球大模型盲测总榜中超越 Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1，位列国产第一，与 GPT、Claude、Gemini 最强模型接近。在编程智能体方面，SWE-Pro、SWE-Multilingual 等测评领先，Terminal Bench 2.0 得分 69.7。通用智能体能力显著提升，在 MCP-Atlas、MCP-Mark 等现实测试中创国产新高。新增 preserve_thinking 参数，保留前序思维内容以增强 Agent 决策一致性，减少重复推理 Token 消耗，默认关闭。实测在 Claude Code 下跨框架泛化能力不错，但需要更精准的提示词和多轮迭代。

AI模型 Qwen3.7-Max 国产模型编程智能体 Agent MCP/工具

推荐理由：Qwen3.7-Max 在多项基准上追平国际顶尖模型，做 Agent 和编程自动化的开发者可以直接拿来替代闭源方案，尤其是 preserve_thinking 参数对长周期任务很有用，值得一试。

原文