17:09歸藏(guizang.ai)@op741878°MiMo 推出 V2.5 Pro UltraSpeed 模型,实现每秒输出超过 1000 Token,成为全球首个达到此速度的万亿参数模型。实测中,复杂 3D 游戏生成峰值达 1426 Token/s,32 秒输出 25624 Token。该模型在保持高推理速度的同时,未出现能力下降,适合 Agent 和并发场景。藏师傅的测试显示,其首次响应时间低至 0.83 秒,代码生成质量高。目前面向 To B 客户,成本有待优化。AI模型MiMo超高速模型万亿参数推理模型Agent场景推荐理由:万亿参数模型跑出 1000+ Token/s 的速度,做 Agent 和实时交互的开发者可以直接体验,效率提升肉眼可见。原文
15:39pandaily@contact@pandaily.com (Pandaily)精选76°Sphere AI Lab 开源了 Orbit,一个强化学习后训练框架,支持在单个 8×B200 节点上对万亿参数模型(如 DeepSeek-V4)进行微调。该框架通过优化内存和计算效率,大幅降低了大规模模型训练的门槛,使得资源有限的团队也能进行高效的后训练。Orbit 的发布解决了万亿参数模型训练需要大规模集群的痛点,有望推动更多研究者和开发者参与大模型的后训练优化。AI模型开源/仓库强化学习后训练万亿参数DeepSeek-V4推荐理由:Orbit 让万亿参数模型的后训练不再依赖大规模集群,做 RL 微调或大模型优化的团队可以直接在单节点上跑 DeepSeek-V4,建议试试这个开源方案。原文