03:35NVIDIA AI@NVIDIAAINVIDIA AI 官方账号在 X 平台发布 Nemotron Labs 的最新研究成果,聚焦文本扩散模型与弹性推理技术。文本扩散模型是一种新型生成式 AI 方法,能够更高效地处理文本生成任务,而弹性推理则旨在优化推理过程中的计算资源分配,提升模型在复杂任务中的表现。该技术有望降低大模型的部署成本,并提高推理速度,对 AI 研究和应用开发者具有重要参考价值。论文文本扩散弹性推理NVIDIANemotron Labs推理优化2 个信源在谈推荐理由:NVIDIA 在文本生成和推理效率上的新突破,做 NLP 或大模型部署的团队值得关注,能直接启发你优化模型性能。原文