AITOP
← 首页
/
AI 热点日报
/
话题
№
dppo
·
concept
DPPO
别名
首次出现
2026-06-09
最近出现
2026-06-09
累计提及
2
§ 01
综述
∅
DPPO
的综述正在准备。
相关报道少于 3 条时不强行生成。
§ 02
相关报道
02 条在档
01
腾讯混元发布UniRL:统一多模态强化学习框架
Hunyuan
↗
02
DRPO:用平滑散度正则化改进LLM强化学习稳定性
arXiv cs.LG
↗
§ 03
邻近话题
DrPO
×3
GRPO
×2
强化学习
×2
Experiments
×1
LLM后训练
×1
腾讯
×1
Regularization
×1
开源/仓库
×1