09:48arXiv cs.AI@Enrico Cassano, Michał Brzozowski, Zuzanna Dubanowska, Paolo Mandica, Neo Christopher ChungARIADNE是一个无需训练、与适配器无关的动态适配器选择框架。它通过计算每个适配器训练集嵌入的质心,在推理时根据无标签输入与质心的距离选择适配器。在Llama 3.2 1B Instruct上对23个NLP任务测试,恢复了97.44%的上界性能。扩展到44个任务时,平均选择准确率达到89.7%。无需访问适配器内部参数或额外训练。论文ARIADNELlama 3.2PEFT推理路由适配器选择推荐理由:这篇论文提出了ARIADNE,一个不用训练就能自动为输入选对适配器的方法,在Llama 3.2上恢复了97%的上界性能,比现有路由方式更灵活。原文
08:51marktechpost@Sana Hassan精选本教程详细介绍了在Google Colab上使用QLoRA和DPO微调LFM2模型的完整步骤。步骤包括使用TRL库进行监督微调(SFT),然后应用DPO算法优化,最后合并适配器。教程提供了可运行的代码和详细解释,适合有基础的用户实践。所有操作在免费的Colab环境下完成。技巧LFM2QLoRADPOGoogle ColabTRLPEFT微调推荐理由:手把手教你微调LFM2,用Colab免费跑原文