精选理由
做AI智能体运维或安全治理的团队终于有了一个轻量级工具来告诉智能体哪些资源不能碰,实测效果显著,建议直接看实验设计和适配器实现。
论文提出了一种轻量级协议——Recuse Signal,允许服务器通过现有协议通道(如SSH横幅、PostgreSQL NOTICE)向连接的LLM智能体发送“请退出”信号,类似于robots.txt对爬虫的控制。实验表明,在SSH场景下,该信号能100%诱导智能体退出,而对照组则100%完成任务。但该信号是合作性而非绝对性的:当操作员明确授权时,最强模型会继续执行,其他模型则仍遵循主机策略。研究释放了标准、适配器和实验工具,为智能体行为治理提供了新思路。
AI 翻译 · 中文
论文提出了一种轻量级协议——Recuse Signal,允许服务器通过现有协议通道(如SSH横幅、PostgreSQL NOTICE)向连接的LLM智能体发送“请退出”信号,类似于robots.txt对爬虫的控制。实验表明,在SSH场景下,该信号能100%诱导智能体退出,而对照组则100%完成任务。但该信号是合作性而非绝对性的:当操作员明确授权时,最强模型会继续执行,其他模型则仍遵循主机策略。研究释放了标准、适配器和实验工具,为智能体行为治理提供了新思路。
As autonomous LLM agents increasingly hold real credentials and operate infrastructure without a human in the loop, operators have no standard way to tell an agent that a resource is off-limits. Access controls either le…