AI模型精选72°

torchtune:PyTorch 原生后训练库,高效微调 LLM

torchtune: PyTorch native post-training library

精选理由

做 LLM 微调的研究者或工程师,如果受够了黑盒框架的调试痛苦,torchtune 的模块化设计和 PyTorch 原生体验值得一试,能让你在保持性能的同时自由定制训练流程。

AI 摘要

torchtune 是一个 PyTorch 原生的后训练库,旨在简化大语言模型(LLM)的微调、实验和部署流程。与 Axolotl、Unsloth 等框架相比,torchtune 强调模块化、可定制性和对底层 PyTorch 组件的直接访问,而非牺牲透明度和可扩展性。论文展示了其模型构建器、训练配方和分布式训练栈的设计,并在多种后训练场景中评估了性能。结果表明,torchtune 在保持强性能和内存效率的同时,足够灵活以支持快速研究迭代。该库为可复现的 LLM 后训练研究提供了实用基础。

AI 翻译 · 中文

torchtune 是一个 PyTorch 原生的后训练库,旨在简化大语言模型(LLM)的微调、实验和部署流程。与 Axolotl、Unsloth 等框架相比,torchtune 强调模块化、可定制性和对底层 PyTorch 组件的直接访问,而非牺牲透明度和可扩展性。论文展示了其模型构建器、训练配方和分布式训练栈的设计,并在多种后训练场景中评估了性能。结果表明,torchtune 在保持强性能和内存效率的同时,足够灵活以支持快速研究迭代。该库为可复现的 LLM 后训练研究提供了实用基础。

arXiv cs.AIModern LLMs typically require multistage training pipelines to achieve strong downstream performance, with post-training serving as the main interface for adapting open-weight models. We introduce torchtune, a PyTorch-na