监督 vs 示例学习：土耳其语多词表达分类的上下文学习研究

精选理由

这项研究揭示了提示设计对多词表达分类的关键影响，做自然语言处理尤其是低资源语言语义分析的团队值得关注，直接参考其示例构建策略可提升模型效果。

AI 摘要

该研究针对土耳其语中具有歧义的轻动词结构（LVC）进行分类，区分其字面义与习语义。研究者对比了监督学习模型（BERTurk）与三种指令微调大语言模型（LLM）在零样本、单样本和少样本提示下的表现。结果显示，零样本下LLM对LVC召回率低，单样本提示虽提升检测但引入模型特定偏差，而少样本提示能改善校准。最终，监督基线仍具竞争力，但精心设计的示例可使LLM在LVC分类上达到或超越监督模型。

AI 翻译 · 中文

arXiv cs.AITurkish idiomatic light verb constructions (LVCs) are challenging for multiword expression processing because they often share the same surface form as fully literal verb-object combinations while functioning as a single…

阅读原文