从观测学习 Red Agent Policy 的神经符号自主防御智能体

精选理由

这篇论文用模仿学习帮防守方预测攻击者行动，在模拟网络攻防场景下准确率很高。

AI 摘要

本文提出一种基于模仿学习的策略学习技术，用于在部分可观测的自主网络环境中预测红方（攻击方）动作。该方法适用于离散状态和离散动作的强化学习智能体。集成到使用行为树和LECs的神经符号自主防御智能体后，该方法能有效处理不同红方策略，并在多种模拟场景下实现高预测准确率。

AI 翻译 · 中文

arXiv cs.AIWith sophisticated cyber-attacks becoming increasingly prevalent, modern networks require intelligent autonomous cyber-defense agents trained via Reinforcement Learning (RL). These agents employ neurosymbolic approaches …

阅读原文