PEFT-Arena：从稳定性-可塑性视角理解参数高效微调

精选理由

做 LLM 微调的团队终于有了评估预训练能力保持的基准——PEFT-Arena 帮你选方法时不再只看下游指标，建议做模型适配的开发者点开看看。

AI 摘要

论文提出 PEFT-Arena 基准，从稳定性-可塑性困境（目标任务适应 vs 预训练能力保持）评估参数高效微调方法。研究发现，在同等参数预算下，正交微调在帕累托前沿上表现最佳。通过权重空间谱分析和激活空间表示保持分析，解释了不同方法遗忘预训练能力的原因。最终检查点往往偏离最优平衡点，论文展示了路径回退的后处理改进案例。

AI 翻译 · 中文

arXiv cs.LGParameter-efficient finetuning (PEFT) has become the standard approach for adapting large language models, yet evaluations largely emphasize downstream accuracy while overlooking the retention of pretrained capabilities.…

阅读原文