LLM标注指南的迭代优化与复用方法

精选理由

做生物医学NLP或数据标注的团队，可以用这套方法低成本提升LLM标注质量，值得参考实验设计。

AI 摘要

该研究提出一种系统性的标注指南复用与优化框架，通过模拟标注项目早期阶段的迭代审核机制，提升大语言模型在零样本标注任务中的表现。在三个生物医学命名实体识别数据集（NCBI Disease、BC5CDR、BioRED）上，使用GPT、Gemini、DeepSeek三类模型进行测试，验证了指南整合的有效性、推理优化模型的优势以及最小监督下审核的可行性。实验表明该框架能有效优化标注指南，但仍有较大改进空间。

AI 翻译 · 中文

arXiv: DeepSeekWhile Large Language Models (LLMs) demonstrate remarkable performance on zero-shot annotation tasks, they often struggle with the specialized conventions of gold-standard benchmarks. We propose the systematic reuse and r…

阅读原文