AI-PAVE-Br:基于大语言模型和黄金集的巴西电商属性值提取

AI-PAVE-Br: Leveraging Large Language Models for Enhanced Product Attribute Value Extraction through a Golden Set Approach

精选理由

这篇论文做了个巴西电商的属性提取系统,用LLM加提示工程比传统NER强不少,还公开了葡萄牙语数据集。

AI 摘要

巴西电商产品数据激增,传统命名实体识别(NER)难以处理葡萄牙语描述差异。论文提出AI-PAVE-Br系统,使用大语言模型(LLM)进行产品属性值提取(PAVE),并发布Golden Set——一个手动注释的葡萄牙语PAVE基准数据集(含实体、品类、子品类)。实验表明,AI-PAVE-Br通过定向提示工程,在PAVE任务上显著超越传统NER基线。该成果为巴西电商提供了可扩展方案,并向NLP社区公开了高质量评测资源。

AI 翻译 · 中文

巴西电商产品数据激增,传统命名实体识别(NER)难以处理葡萄牙语描述差异。论文提出AI-PAVE-Br系统,使用大语言模型(LLM)进行产品属性值提取(PAVE),并发布Golden Set——一个手动注释的葡萄牙语PAVE基准数据集(含实体、品类、子品类)。实验表明,AI-PAVE-Br通过定向提示工程,在PAVE任务上显著超越传统NER基线。该成果为巴西电商提供了可扩展方案,并向NLP社区公开了高质量评测资源。

arXiv cs.LGThe explosive growth and complexity of product data within the dynamic Brazilian e-commerce landscape demand robust and specialized methods for structured information extraction. Traditional approaches to Product Attribu