全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月23日

05:18

05:18

NVIDIA AI@NVIDIAAI

72°

NVIDIA Research 推出 LongLive-2.0，一个端到端的 NVFP4 训练与推理系统，专门解决长视频生成问题。该系统将 NVFP4 感知训练、蒸馏和 W4A4 推理对齐，弥补了低精度部署中训练与运行之间的差距。在保持基准质量的同时，显著提升了速度和内存效率。这标志着长视频生成从模型问题转向系统问题，为实际部署提供了更高效的方案。

AI模型 NVIDIA 长视频生成 NVFP4 训练推理系统低精度部署

推荐理由：长视频生成一直受限于计算和内存瓶颈，NVIDIA 这次从系统层面给出了端到端方案。做视频生成模型训练或部署的团队，可以直接参考这套 NVFP4 对齐方法，提升效率。

5月21日

09:46

09:46

arXiv cs.AI@Bo Ye, Xinyu Cui, Jian Zhao, Tong Wei, Min-Ling Zhang

精选

自回归长视频生成通常采用有界内存流式处理，结合局部窗口和静态早期帧汇（sink）来保持长期连续性。但静态帧汇在视觉状态大幅变化后仍缓存早期帧，丢弃了可能更相关的中间历史，导致生成偏向过时内容，甚至引发注意力坍塌。DySink 提出基于检索的动态帧汇框架，维护紧凑记忆库并选择视觉相关的历史帧作为动态汇，同时引入异常检测门控抑制坍塌。实验表明，DySink 在分钟级视频上持续提升动态度指标，并实现更高时间质量。代码和模型权重将开源。

论文长视频生成自回归模型动态帧汇注意力机制开源/仓库

推荐理由：长视频生成长期受困于静态帧汇导致的注意力坍塌问题，DySink 用检索式动态帧汇解决了这个痛点，做视频生成或自回归模型的团队可以直接参考其开源代码。