近期,AI 推理模型“Thinking”成为行业热点,微软、OpenAI 等巨头纷纷推出新进展。
微软发布 MAI-Thinking-1 模型:微软推出自研推理模型 MAI-Thinking-1,参数规模达 35B 激活参数,属于 MoE 架构,擅长复杂推理任务(如数学、编码)。该模型已集成到 Azure AI 和 Copilot 平台,标志着微软在推理赛道正式发力(微软发布 MAI-Thinking-1 和 MAI-Code-1-Flash 模型)。
OpenAI 改进推理交互体验:OpenAI 在 ChatGPT 移动端推出长按发送键提前选择 AI 响应档位功能,允许用户指定“快速”或“深度思考”模式,优化了推理使用的便捷性(OpenAI 升级 ChatGPT 移动端:长按发送键可提前选 AI 响应档位)。此外,GPT-5.5 Instant 升级后回复更自然易读,推理能力有所提升(OpenAI 升级 GPT-5.5 Instant,回复更自然易读)。
学界与行业动态:DeepSeek 发布研究论文 OptSkills,通过问题原型聚类蒸馏实现优化技能泛化学习,探索推理模型的轻量化训练方法(OptSkills:基于问题原型的聚类蒸馏实现优化技能泛化学习)。同时,Lilian Weng 呼吁加强人机交互研究,并宣布 Thinking Machines 提供 10 万美元资助,聚焦推理模型的可解释性与用户协作(Lilian Weng 呼吁人机交互研究,Thinking Machines 提供 10 万美元资助)。
当前焦点在于推理模型的性能提升与实际应用落地,竞争从预训练转向推理优化和交互体验。未来需关注各厂商如何平衡深度推理与响应速度,以及推理模型在复杂场景下的泛化能力。