MSBuild 2025 聚焦 AI 推理的规模化落地、设备端智能体以及开发者工具链。在首日,微软推出 Project Solara 平台,旨在为智能体优先设备提供底层支持,并宣布与高通合作,推动端侧 AI 性能提升 (Satya Nadella)。与此同时,Microsoft Research 发布 MagenticLite,一个轻量级小模型,用于驱动设备端智能体体验,降低推理延迟与资源消耗 (MSFTResearch)。
Fireworks AI 在 MSBuild 上成为亮点,其展示了从模型微调到生产推理的全链路能力。Fireworks AI 登陆 Microsoft Foundry 平台,使开发者能直接使用其高性能推理服务 (Fireworks AI)。在后续的演示中,Fireworks AI 强调了从测试到生产环境迁移时遇到的性能优化、规模扩展等基础设施挑战,并展示了 Foundry 上的定制化推理能力 (Fireworks AI)。此外,一场专门讨论指出,团队在“微调到生产推理的鸿沟”上普遍卡在性能调优、成本控制与工程复杂性之间,Fireworks AI 给出了系统性解决方案 (Fireworks AI)。
当前焦点在于:大模型从实验到生产依然面临显著的工程鸿沟,设备端推理作为新趋势正在获得平台化支持。未来观察点包括:微软 Project Solara 落地后的实际生态反馈、MagenticLite 在消费级设备上的性能表现,以及 Fireworks AI 与 Foundry 的集成能否降低生产级推理的门槛。