11:42Ate-a-Pi@svpino72°一位技术博主分享了一种新颖的视频生成模型训练方法,团队没有使用大型互联GPU集群,而是用多个小型、独立的GPU集群分别训练不同的“专家”模型。这些专家模型在训练时无需通信,训练完成后通过一个智能路由器在推理时动态组合,协同工作。这种方法降低了硬件门槛,且效果出色。论文链接已附,值得技术爱好者深入阅读。技巧视频生成分布式训练专家模型推理路由论文推荐理由:这种分布式训练思路颠覆了传统大模型训练范式,做模型训练或视频生成的开发者可以看看论文,或许能启发新的低成本训练方案。原文
04:44rohanpaul_ai@rohanpaul_ai大多数 AI 团队仍像从单一供应商买软件一样购买推理服务:选一个模型、接受固定价格、持续付费,即使更便宜的模型也能完成相同工作。The Grid AI 采用不同方法:用户只需选择任务等级(标准、高级、最大),系统自动将请求路由到符合该等级的最便宜供应商。这意味着应用使用同一 API,但背后的模型可随价格和质量变化。作者在 Ubuntu 上测试了 Hermes Agent 与 The Grid 的集成,用于读取支持工单、应用策略文件并编写分类报告。AI产品推理路由成本优化The Grid AI模型选择API推荐理由:做 AI 推理的团队终于有了按需降本的方法——不用改代码就能自动切换更便宜的模型,适合处理大量相似任务的开发者直接试试。原文