AITOP
← 首页
/
AI 热点日报
/
话题
№
d4rl
·
general
D4RL
别名
首次出现
2026-05-22
最近出现
2026-05-23
累计提及
2
§ 01
综述
∅
D4RL
的综述正在准备。
相关报道少于 3 条时不强行生成。
§ 02
相关报道
01 条在档
01
COOPO:循环离线-在线策略优化算法,提升强化学习效率
arXiv cs.AI
↗
§ 03
邻近话题
COOPO
×3
Online Reinforcement Learning
×2
Each
×2
KL-regularized
×2
Cyclic
×2
optimization
×2
Theoretically
×2
Offline-Online
×2