EvoHunt：可迁移自进化剧本用于智能体安全审计

精选理由

这篇论文讲EvoHunt，能自动生成安全审计剧本，还能把经验迁移给弱模型，效果比商用产品还好。

AI 摘要

EvoHunt是一个在开源仓库上运行的安全审计剧本进化环境。它使用三个智能体驱动循环：审计智能体执行当前剧本，评估器根据真实情况打分，修订者根据失败分析更新剧本。在开源安全公告评估中，EvoHunt使Codex/GPT5.4-xhigh的端到端漏洞利用成功率从1.1%提升至6.2%。GLM5.1演变出的剧本在目标匹配率上达到11.3%，超过OpenAI Codex Security的9.2%。转移实验显示，Qwen3.6-27B借助GLM剧本从2.4%提升至6.5%，Qwen3.6-35B-A3B从1.1%提升至4.6%。

AI 翻译 · 中文

arXiv: OpenAIAn LLM agent for vulnerability discovery and validation is more than a model. It combines three components: an LLM for code analysis, an agent harness such as Codex or OpenCode for navigation, tool use, and execution, an…

宝玉06-16 23:30原文
OpenAI06-16 19:42原文
marktechpost06-13 17:27原文
shao__meng06-15 00:37原文
Geek06-15 11:19原文
@OpenAIDevs06-15 21:30原文
berryxia06-16 04:42原文
@zarazhangrui06-16 04:43原文
@hebbia06-16 05:43原文
Decoder06-16 09:44原文

阅读原文