快速且忠实的函数向量:改进LLM上下文学习中的任务表示

Fast & Faithful Function Vectors

精选理由

这项研究为LLM任务表示提供了更高效、更准确的方法,做模型微调或上下文学习的开发者可以直接参考其开源代码来优化自己的应用。

AI 摘要

函数向量(FVs)是在上下文学习中提取的任务表示,可用于引导大型语言模型(LLMs)。本研究探讨了不同FV定义对指令的影响,主要关注注意力头选择和引导两个自由度。在头选择上,使用基于梯度的归因方法(如层相关性传播LRP)显著提高了效率和准确性。在FV引导方面,分布式应用比简单聚合获得了更高的准确性。代码已公开。

AI 翻译 · 中文

函数向量(FVs)是在上下文学习中提取的任务表示,可用于引导大型语言模型(LLMs)。本研究探讨了不同FV定义对指令的影响,主要关注注意力头选择和引导两个自由度。在头选择上,使用基于梯度的归因方法(如层相关性传播LRP)显著提高了效率和准确性。在FV引导方面,分布式应用比简单聚合获得了更高的准确性。代码已公开。

arXiv cs.LGFunction vectors (FVs) are task representations elicited during in-context learning that can be used to steer Large Language Models (LLMs). However, design choices in their formulation remain underexplored. In this work,