全部 AI 动态 · AI 热点

6月30日

11:10

11:10

arXiv cs.LG@Shihao Zhang, Yuguang Yan, Junzhe Zhang, Wei Zhao, Bohan Wang, Hanwang Zhang

文本到视频扩散模型通常依赖额外奖励信号（如奖励模型或DPO）对齐人类偏好，但计算成本高且需人工标注。本文提出数据流形本身可作为奖励模型，通过显式建模高质量SFT数据的流形结构获得密集、可微、近乎零成本的奖励信号。基于局部坐标编码（LCC）捕获流形骨架，但LCC存在均值回归问题导致丢失高频细节。为此提出Shell-LCC，建模流形表面为各向同性壳层以对齐真实高密度区域。实验表明Shell-LCC能提升真实感、增强高频细节、减少过平滑伪影并缓解运动模糊。

论文 Shell-LCC LCC T2V 视频生成奖励模型

推荐理由：这篇论文发现数据流形本身就是好奖励，提出Shell-LCC，不花啥钱就能让AI生成的视频更清晰、少模糊，比加奖励模型省事多了。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？