全部 AI 动态 · AI 热点

6月29日

13:48

13:48

Ethan Mollick@emollick

一项实验测试了AI在端到端编码任务中的能力。Opus 4.7在14小时内构建了一个软件包，相当于人类工程师2-17周的工作量，总花费251美元。虽然模型仍不完美，但进步速度显著。

AI模型 Opus 4.7 编程助手编码能力 AI基准测试

推荐理由：Opus 4.7只用14小时和251块就干完了人类几周的活，虽然还有瑕疵，但进步真的快。

6月17日

12:40

12:40

orange.ai@oran_ge

GLM-5.2 由 Z.ai 发布，在编码和智能体任务上取得显著进步，首次让开源模型在 Coding 能力上达到 Opus 水平。模型支持 1M 上下文窗口，提供两种推理努力级别（max 和 high），权重采用 MIT 开源许可，API 定价与 GLM-5.1 相同。

AI模型 GLM-5.2 Z.ai 开源模型编码能力推理模型

推荐理由：Z.ai 开源了 GLM-5.2，编码水平追上 Opus，还给了 1M 上下文和两种推理模式，MIT 许可随便用。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

6月4日

01:28

01:28

SiliconFlowAI@siliconflowai

83°

MiniMax 最新开源模型 M3 已在 SiliconFlow 平台上线，首周提供 50% 折扣。M3 是首个同时具备编码与智能体能力、1M 上下文窗口和原生多模态的开源模型。在 SWE-Bench Pro 基准测试中，M3 的编码能力超越了 GPT-5.5 和 Gemini 3.1 Pro。其 1M 上下文窗口通过 MiniMax 稀疏注意力技术实现，原生多模态支持图像、视频和计算机使用。定价方面，缓存/输入/输出分别为每百万 token 0.06/0.30/1.20 美元，折扣后性价比突出。

AI模型 MiniMax M3 开源模型编码能力多模态

推荐理由：M3 把编码、长上下文和多模态三合一开源了，做 AI 应用开发的团队可以直接在 SiliconFlow 上低成本试用，编码能力还超过了 GPT-5.5，值得上手体验。

6月2日

10:35

10:35

Harrison Chase@hwchase17

精选76°

MiniMax 正式发布 M3 模型，这是首个同时具备编码、智能体能力和原生多模态的开放权重模型。在 SWE-Bench Pro 上达到 59.0%，Terminal Bench 2.1 为 66.0%，并支持 1M 上下文窗口。模型权重和技术报告将在约 10 天后公开。开发者可通过 API 和专属代码平台 code.minimax.io 使用。

AI模型 MiniMax M3 开源模型编码能力智能体

推荐理由：MiniMax M3 把编码、智能体和多模态三合一开源，做 AI 应用和 Agent 开发的团队可以直接拿来用，尤其适合需要长上下文和复杂任务自动化的场景。

5月14日

15:02

15:02

xiaomimimo@XiaomiMiMo

73°

小米MiMo-V2.5-Pro在最新Arena排行榜（2026年4月26日）中取得多项突破：在Text Arena专家级排名全球第6、开源模型第1，并在中国模型中排名第1，小米实验室整体排名全球第3，仅次于Anthropic和OpenAI。该模型在Text Arena综合排名中位列开源第2，在Code Arena网页开发排名中位列开源第3。此外，在Hard Prompts、指令遵循、长查询等4个子榜单中均获开源第1。这些成绩基于真实社区盲评，反映了模型的实际能力。

AI模型小米 MiMo-V2.5-Pro 开源模型排行榜编码能力

推荐理由：小米MiMo-V2.5-Pro在多个高难度榜单中超越众多闭源模型，做模型选型或关注开源生态的开发者值得关注——它证明了开源模型在核心智能和实际编码任务上已能媲美顶级闭源方案。