全部 AI 动态 · AI 热点

6月30日

03:08

03:08

@koltregaskes@koltregaskes

78°

GPT-5.6 Sol Preview 出现在 Cursor 的内部测试中，据称支持 100 万 token 上下文窗口。该发现来自 X 用户 koltregaskes 的截图，暗示 OpenAI 正在推进超长上下文能力。若属实，这将远超 GPT-4 的 128K 上下文上限。目前 OpenAI 尚未官方确认此模型的存在。

AI模型 GPT-5.6 Sol Preview Cursor 上下文窗口 1M上下文

推荐理由：OpenAI 的 GPT-5.6 Sol Preview 悄悄在 Cursor 里测试，上下文直接拉到 1M，能一口气吞整本小说了。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月15日

23:52

23:52

Julien Chaumond@julien_c

83°

Mistral AI 正式确认即将发布 Le Chaton Fat，这是一个拥有 30 万亿参数（30T）的混合专家（MoE）模型，配备 256 个专家。该模型支持 1M 上下文窗口，具备多模态和多语言能力，并在所有基准测试上超越 Fable 5。具体发布日期尚未公布。

AI模型 MistralAI Le Chaton Fat MoE 多模态 1M上下文

推荐理由：Mistral 要发一个 30T 参数、256 专家的超大 MoE 模型，还带 1M 上下文和多模态，性能吊打 Fable 5，开源有望了。

6月13日

17:51

17:51

shao__meng@shao__meng

智谱发布GLM-5.2旗舰模型，面向所有GLM Coding Plan用户（Lite、Pro、Max、Team）开放。该模型具备强大编码能力，支持1M上下文，并在长任务处理上持续优化。API和聊天机器人服务将于下周上线，模型也将以MIT许可证正式开源。

AI模型 GLM-5.2 智谱开源模型编码助手 1M上下文

推荐理由：智谱GLM-5.2开源，1M上下文编码强

14:36

14:36IT之家（博客/媒体）

智谱宣布 GLM-5.2 将面向 GLM Coding Plan 全量用户开放，覆盖 Lite、Pro、Max 及团队版。该模型支持 1M 上下文，是智谱迄今能力最强的开源模型，在长程任务中保持领先。GLM-5.2 API 将于下周上线，模型将遵循 MIT 协议正式开源。此前智谱于 3 月发布 GLM-5.1，5 月发布输出速度达 400 tokens/s 的 GLM-5.1 高速版。

AI模型 GLM-5.2 智谱开源模型 1M上下文

推荐理由：智谱最强开源模型下周上线

10:53

10:53

Together AI@togethercompute

精选

MiniMax 发布开源权重原生多模态模型 MiniMax-M3，具备 1M 上下文窗口和 MiniMax 稀疏注意力机制。模型提供思考与非思考两种模式。Together AI 作为首选云合作伙伴，通过推理优化在并发场景下实现高达 125% 的吞吐量提升。

AI模型 MiniMax-M3 Together AI 多模态开源模型 1M上下文

推荐理由：MiniMax 新模型上线，吞吐量提升 125%

6月12日

22:47

22:47

vLLM@vllm_project

73°

MiniMax AI 发布了新一代开源模型 MiniMax M3，具备前沿的编码和智能体能力，原生支持图像和视频输入、计算机使用功能，并拥有 100 万 token 的上下文窗口。其核心是 MSA（MiniMax Sparse Attention）稀疏注意力架构，通过仅对 top 128-token KV 块进行注意力计算，大幅降低了长上下文推理的计算成本。M3 已在 vLLM 中实现首日支持，可在 NVIDIA 和 AMD 硬件上运行，支持 BF16 和 MXFP8 检查点、MoE 后端、多模态输入、工具调用和推理控制。这一成果是 MiniMax、NVIDIA、AMD 和 vLLM 社区合作的结晶。

AI模型 MiniMax M3 稀疏注意力 1M上下文开源模型 vLLM

推荐理由：M3 的 1M 上下文和稀疏注意力架构解决了长文档和复杂智能体任务的性能瓶颈，做 RAG、代码分析和自动化工作流的团队可以直接在 vLLM 上部署试用。

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月27日

13:43

13:43

阿里云 Alibaba Cloud@alibaba_cloud

精选

阿里云宣布 Qwen3.7 Max 模型现已支持 Go 语言，通过 OpenCode 集成。该模型拥有 1M 上下文窗口，推理能力更强，为开发者带来更多可能性。这一更新使得 Go 语言开发者能够直接利用 Qwen3.7 Max 的强大能力进行复杂任务处理。

AI产品 Qwen3.7 Max Go 1M上下文推理模型 OpenCode

推荐理由：Go 开发者终于能直接调用 Qwen3.7 Max 的 1M 上下文和强推理能力了，做大型代码库分析或长文档处理的团队值得一试。