监督 vs 示例学习:土耳其语多词表达分类的上下文学习研究

Supervision versus Demonstration-Based In-Context Learning for Multiword Expression Classification

精选理由

这项研究揭示了提示设计对多词表达分类的关键影响,做自然语言处理尤其是低资源语言语义分析的团队值得关注,直接参考其示例构建策略可提升模型效果。

AI 摘要

该研究针对土耳其语中具有歧义的轻动词结构(LVC)进行分类,区分其字面义与习语义。研究者对比了监督学习模型(BERTurk)与三种指令微调大语言模型(LLM)在零样本、单样本和少样本提示下的表现。结果显示,零样本下LLM对LVC召回率低,单样本提示虽提升检测但引入模型特定偏差,而少样本提示能改善校准。最终,监督基线仍具竞争力,但精心设计的示例可使LLM在LVC分类上达到或超越监督模型。

AI 翻译 · 中文

该研究针对土耳其语中具有歧义的轻动词结构(LVC)进行分类,区分其字面义与习语义。研究者对比了监督学习模型(BERTurk)与三种指令微调大语言模型(LLM)在零样本、单样本和少样本提示下的表现。结果显示,零样本下LLM对LVC召回率低,单样本提示虽提升检测但引入模型特定偏差,而少样本提示能改善校准。最终,监督基线仍具竞争力,但精心设计的示例可使LLM在LVC分类上达到或超越监督模型。

arXiv cs.AITurkish idiomatic light verb constructions (LVCs) are challenging for multiword expression processing because they often share the same surface form as fully literal verb-object combinations while functioning as a single