精选理由
想知道怎么用CoT提示检测政治回避?这篇论文拿Grok-4-Fast跑出了0.51的F1,比微调Qwen3强,还分析了怎么设计提示最有效。
该论文描述了SemEval-2026 Task 6的系统,针对美国总统采访中的政治回避策略分类。比较了两种范式:使用QLoRA对Qwen3(4B-32B)进行参数高效微调,以及使用结构化CoT提示推理模型DeepSeek-V3.2和Grok-4-Fast。Grok-4-Fast在子任务2(9类回避)上取得Macro F1 0.5147,子任务1(3类清晰度)上0.7979,分别排名第8和第13。消融实验表明层次化标签和少样本示例提升了效果,但最强提示变体间Macro F1无显著差异。
AI 翻译 · 中文
该论文描述了SemEval-2026 Task 6的系统,针对美国总统采访中的政治回避策略分类。比较了两种范式:使用QLoRA对Qwen3(4B-32B)进行参数高效微调,以及使用结构化CoT提示推理模型DeepSeek-V3.2和Grok-4-Fast。Grok-4-Fast在子任务2(9类回避)上取得Macro F1 0.5147,子任务1(3类清晰度)上0.7979,分别排名第8和第13。消融实验表明层次化标签和少样本示例提升了效果,但最强提示变体间Macro F1无显著差异。
This paper describes our system for SemEval-2026 Task 6, which addresses the classification of political evasion strategies in English question-answer pairs extracted from U.S. presidential interviews. We systematically …
- IT之家06-16 09:25原文