11:46arXiv cs.LG@Murilo Gazzola, Hugo Gobato Souto, Samuel Silva, Júlia Schubert Peixoto, Felipe Siqueira, André Luis Pedroso de Morais, Caio Gomes巴西电商产品数据激增,传统命名实体识别(NER)难以处理葡萄牙语描述差异。论文提出AI-PAVE-Br系统,使用大语言模型(LLM)进行产品属性值提取(PAVE),并发布Golden Set——一个手动注释的葡萄牙语PAVE基准数据集(含实体、品类、子品类)。实验表明,AI-PAVE-Br通过定向提示工程,在PAVE任务上显著超越传统NER基线。该成果为巴西电商提供了可扩展方案,并向NLP社区公开了高质量评测资源。论文AI-PAVE-BrGolden Set大语言模型巴西电商属性值提取推荐理由:这篇论文做了个巴西电商的属性提取系统,用LLM加提示工程比传统NER强不少,还公开了葡萄牙语数据集。原文