论文精选

AR1-ZO:拓扑感知的秩1零阶查询实现高秩LoRA微调

AR1-ZO: Topology-Aware Rank-1 Zeroth-Order Queries for High-Rank LoRA Fine-Tuning

精选理由

解决了零阶优化与高秩LoRA结合时的信号坍缩问题,做大模型微调且受限于显存的开发者可以直接用AR1-ZO方法提升效果。

AI 摘要

零阶优化(ZO)无需存储反向传播激活即可微调大模型,而LoRA提供紧凑的可训练适配器。但两者结合存在秩悖论:增加LoRA秩会提升适配器容量,但标准两点ZO要么扰动依赖秩的坐标数,要么在原子更新下使有限差分信号不可观测。本文证明瓶颈是测量拓扑问题,而非需要外部子空间。LoRA已分解为匹配的秩1原子,每个原子是一个完整因子坐标块。AR1-ZO通过交替秩1原子查询和拓扑感知缩放,恢复秩不变的有效信号,无需辅助基、激活钩子、曲率估计或额外前向查询。实验表明,在标准两前向查询预算下,AR1-ZO使高秩LoRA在匹配预算的ZO方法中有效。

AI 翻译 · 中文

零阶优化(ZO)无需存储反向传播激活即可微调大模型,而LoRA提供紧凑的可训练适配器。但两者结合存在秩悖论:增加LoRA秩会提升适配器容量,但标准两点ZO要么扰动依赖秩的坐标数,要么在原子更新下使有限差分信号不可观测。本文证明瓶颈是测量拓扑问题,而非需要外部子空间。LoRA已分解为匹配的秩1原子,每个原子是一个完整因子坐标块。AR1-ZO通过交替秩1原子查询和拓扑感知缩放,恢复秩不变的有效信号,无需辅助基、激活钩子、曲率估计或额外前向查询。实验表明,在标准两前向查询预算下,AR1-ZO使高秩LoRA在匹配预算的ZO方法中有效。

arXiv cs.AIZeroth-order (ZO) optimization enables large-language-model fine-tuning without storing backpropagation activations, while LoRA supplies compact trainable adapters. Combining them creates a rank paradox: increasing LoRA