03:08@koltregaskes@koltregaskes78°GPT-5.6 Sol Preview 出现在 Cursor 的内部测试中,据称支持 100 万 token 上下文窗口。该发现来自 X 用户 koltregaskes 的截图,暗示 OpenAI 正在推进超长上下文能力。若属实,这将远超 GPT-4 的 128K 上下文上限。目前 OpenAI 尚未官方确认此模型的存在。AI模型GPT-5.6 Sol PreviewCursor上下文窗口1M上下文8 个信源在谈推荐理由:OpenAI 的 GPT-5.6 Sol Preview 悄悄在 Cursor 里测试,上下文直接拉到 1M,能一口气吞整本小说了。原文
23:52Julien Chaumond@julien_c83°Mistral AI 正式确认即将发布 Le Chaton Fat,这是一个拥有 30 万亿参数(30T)的混合专家(MoE)模型,配备 256 个专家。该模型支持 1M 上下文窗口,具备多模态和多语言能力,并在所有基准测试上超越 Fable 5。具体发布日期尚未公布。AI模型MistralAILe Chaton FatMoE多模态1M上下文推荐理由:Mistral 要发一个 30T 参数、256 专家的超大 MoE 模型,还带 1M 上下文和多模态,性能吊打 Fable 5,开源有望了。原文
17:51shao__meng@shao__meng智谱发布GLM-5.2旗舰模型,面向所有GLM Coding Plan用户(Lite、Pro、Max、Team)开放。该模型具备强大编码能力,支持1M上下文,并在长任务处理上持续优化。API和聊天机器人服务将于下周上线,模型也将以MIT许可证正式开源。AI模型GLM-5.2智谱开源模型编码助手1M上下文推荐理由:智谱GLM-5.2开源,1M上下文编码强原文
14:36IT之家(博客/媒体)智谱宣布 GLM-5.2 将面向 GLM Coding Plan 全量用户开放,覆盖 Lite、Pro、Max 及团队版。该模型支持 1M 上下文,是智谱迄今能力最强的开源模型,在长程任务中保持领先。GLM-5.2 API 将于下周上线,模型将遵循 MIT 协议正式开源。此前智谱于 3 月发布 GLM-5.1,5 月发布输出速度达 400 tokens/s 的 GLM-5.1 高速版。AI模型GLM-5.2智谱开源模型1M上下文推荐理由:智谱最强开源模型下周上线原文
10:53Together AI@togethercompute精选MiniMax 发布开源权重原生多模态模型 MiniMax-M3,具备 1M 上下文窗口和 MiniMax 稀疏注意力机制。模型提供思考与非思考两种模式。Together AI 作为首选云合作伙伴,通过推理优化在并发场景下实现高达 125% 的吞吐量提升。AI模型MiniMax-M3Together AI多模态开源模型1M上下文7 个信源在谈推荐理由:MiniMax 新模型上线,吞吐量提升 125%原文
22:47vLLM@vllm_project73°MiniMax AI 发布了新一代开源模型 MiniMax M3,具备前沿的编码和智能体能力,原生支持图像和视频输入、计算机使用功能,并拥有 100 万 token 的上下文窗口。其核心是 MSA(MiniMax Sparse Attention)稀疏注意力架构,通过仅对 top 128-token KV 块进行注意力计算,大幅降低了长上下文推理的计算成本。M3 已在 vLLM 中实现首日支持,可在 NVIDIA 和 AMD 硬件上运行,支持 BF16 和 MXFP8 检查点、MoE 后端、多模态输入、工具调用和推理控制。这一成果是 MiniMax、NVIDIA、AMD 和 vLLM 社区合作的结晶。AI模型MiniMax M3稀疏注意力1M上下文开源模型vLLM10 个信源在谈推荐理由:M3 的 1M 上下文和稀疏注意力架构解决了长文档和复杂智能体任务的性能瓶颈,做 RAG、代码分析和自动化工作流的团队可以直接在 vLLM 上部署试用。原文
13:43阿里云 Alibaba Cloud@alibaba_cloud精选阿里云宣布 Qwen3.7 Max 模型现已支持 Go 语言,通过 OpenCode 集成。该模型拥有 1M 上下文窗口,推理能力更强,为开发者带来更多可能性。这一更新使得 Go 语言开发者能够直接利用 Qwen3.7 Max 的强大能力进行复杂任务处理。AI产品Qwen3.7 MaxGo1M上下文推理模型OpenCode推荐理由:Go 开发者终于能直接调用 Qwen3.7 Max 的 1M 上下文和强推理能力了,做大型代码库分析或长文档处理的团队值得一试。原文