12:51Cohere@cohere精选Cohere宣布其首个开源智能体编码模型的4-bit量化版本已可用。该量化版模型体积显著缩小,可在Mac上本地运行。用户可通过链接获取模型权重。此次发布使得开发者能够更便捷地在个人设备上运行智能体编码模型。AI模型Cohere4-bit量化智能体编码模型开源模型推荐理由:Cohere把自己最新的编程智能体模型压缩到4-bit,Mac上就能跑,本地开发效率直接拉满!原文
00:47berryxia@berryxia88°NVIDIA研究员Yukang Chen开源了LongLive 2.0,这是全球首个端到端支持4-bit量化的超长视频生成基础设施,覆盖训练和推理全流程。核心技术包括FP4量化和并行加速,在5B模型上实现45.7 FPS的实时生成速度。该工具支持真实视频训练、few-step蒸馏、多shot训练/推理、序列并行、NVFP4 KV cache和异步VAE解码部署。此前长视频生成面临速度慢或长度受限的问题,LongLive 2.0将4-bit长视频实时生成能力推向开源社区。AI产品NVIDIALongLive 2.04-bit量化视频生成开源/仓库2 个信源在谈推荐理由:做视频生成或AI基础设施的开发者终于有了一个能跑长视频的4-bit开源方案,NVIDIA把训练到推理的整套加速打法打包好了,建议直接试代码。原文