Graph Structured Combinatorial Semi-Bandit论文提出可分离信号非线性奖励关联策略

Graph Structured Combinatorial Semi-Bandit with Nonlinear Reward Associations through Separable Signals

精选理由

新策略搞定图结构非线性关联

AI 摘要

该论文针对图结构组合半赌博机问题,开发了基于图因果奖励建模、解析再生核方法和泰勒近似的自适应策略。理论证明在时间上具有次线性性能保证,数据量上线性扩展。实验使用合成和真实交通数据集验证了框架的有效性。

AI 翻译 · 中文

该论文针对图结构组合半赌博机问题,开发了基于图因果奖励建模、解析再生核方法和泰勒近似的自适应策略。理论证明在时间上具有次线性性能保证,数据量上线性扩展。实验使用合成和真实交通数据集验证了框架的有效性。

arXiv cs.LGThe identification of optimal structures within vast arrays of interconnected data necessitates significant sampling- and computational effort. Learning and leveraging underlying signal dependencies can improve efficienc