精选理由
这篇论文提出一种叫 NNN 的解码方法,能比传统向量点积检索挑出更多样化的文档,在多个基准上都有提升,做搜索相关的值得看看。
论文提出 Non-Negative Elastic Net (NNN) 解码,将检索视为联合解码问题,通过稀疏非负线性组合用文档嵌入重构查询嵌入。理论证明,对所有语料库,NNN 解码能处理稠密检索能处理的全部查询,并在有相关文档的语料库上额外处理稠密检索无法处理的查询。在多个基准测试上,对冻结嵌入应用 NNN 解码带来一致改进;端到端训练嵌入进一步超越稠密检索的所有指标。
AI 翻译 · 中文
论文提出 Non-Negative Elastic Net (NNN) 解码,将检索视为联合解码问题,通过稀疏非负线性组合用文档嵌入重构查询嵌入。理论证明,对所有语料库,NNN 解码能处理稠密检索能处理的全部查询,并在有相关文档的语料库上额外处理稠密检索无法处理的查询。在多个基准测试上,对冻结嵌入应用 NNN 解码带来一致改进;端到端训练嵌入进一步超越稠密检索的所有指标。
Dense retrieval has become the dominant paradigm in information retrieval, in which each document is scored against a query by the inner product of their vector embeddings, and the top-$k$ documents by score are retrieve…