10:32arXiv cs.AI@Wesley Scivetti, Ethan Wilcox, Nathan Schneider, Kanishka Misra, Leonie Weissweiler精选研究聚焦英语中罕见的配对焦点结构(如“let alone”、“much less”),构建新数据集测试模型对其语义的理解。发现中等规模开源模型能掌握这些结构的语义,但仅靠人类规模数据训练的模型失败。语义理解在训练后期出现,晚于句法知识,且与常识知识提升相关。结果表明,开源模型也能理解罕见构式,且其学习与常识知识关联。论文LLM语义理解罕见构式配对焦点结构开源模型推荐理由:这项研究揭示了开源模型也能掌握罕见句式的语义,做 NLP 或语言学研究的开发者可以关注其训练动态与常识知识的关系,对理解模型能力边界有启发。原文