论文精选

CWE-Trace框架揭示微调LLM在漏洞检测中的局限性

Calibration Without Comprehension: Diagnosing the Limits of Fine-Tuning LLMs for Vulnerability Detection in Systems Software

精选理由

这篇论文用800多个Linux内核漏洞样本做了严谨测试,发现LLM微调后只是改分数线,不是真懂安全。检测率刚过50%,别指望它们当安全审计员。

AI 摘要

研究提出CWE-Trace框架,基于834个手动整理的Linux内核样本(覆盖74个CWE)评估LLM的漏洞检测能力。实验发现数据污染对性能无实质帮助:84%的污染样本不携带可用记忆信号。微调仅改变输出阈值(DFI范围-85.5至+94.8 pp),而不改变底层决策策略,模型在历史数据和截止后数据上表现一致。最佳检测准确率仅52.1%(高出随机2.1个百分点),CWE排名Top-1准确率低于1.3%,表明当前LLM缺乏可靠的安全推理能力。

AI 翻译 · 中文

研究提出CWE-Trace框架,基于834个手动整理的Linux内核样本(覆盖74个CWE)评估LLM的漏洞检测能力。实验发现数据污染对性能无实质帮助:84%的污染样本不携带可用记忆信号。微调仅改变输出阈值(DFI范围-85.5至+94.8 pp),而不改变底层决策策略,模型在历史数据和截止后数据上表现一致。最佳检测准确率仅52.1%(高出随机2.1个百分点),CWE排名Top-1准确率低于1.3%,表明当前LLM缺乏可靠的安全推理能力。

arXiv: DeepSeekWhether LLMs scoring well on vulnerability benchmarks genuinely reason about security or merely pattern-match on contaminated data remains unresolved. We present CWE-Trace, a framework for LLM vulnerability detection bui