全部 AI 动态 · AI 热点

6月29日

10:09

10:09

arXiv cs.AI@Guanbo Huang, Jingjia Mao, Fanding Huang, Fengkai Liu, Xiangyang Luo, Yaoyuan Liang, Jiasheng Lu, Xiaoe Wang, Pei Liu, Ruiliu Fu, Ruqi Huang, Shao-Lun Huang

流匹配（Flow Matching）存在暴露偏差，现有缓解方法依赖静态约束。本文提出DEFAR框架，包含抗漂移修正（ADR）和频率补偿（FC）两个组件。ADR利用推理时漂移信号学习将偏离状态拉回目标方向，FC基于偏差自反馈权重增强缺失的低频成分。在CIFAR-10、CelebA-64、ImageNet-256/512上，DEFAR优于先前基线，且具有良好的可扩展性与推理鲁棒性。

论文 Flow Matching DEFAR 暴露偏差自修正图像生成

推荐理由：这篇论文让模型靠偏差自己修正偏差，DEFAR在CIFAR和ImageNet上都能超过之前的方案，还更稳。

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

10:52

10:52

arXiv cs.LG@Jize Xie, Haomiao Wu, Qiang Chen, Xiu Su, Yi Chen

精选

论文提出决策加权流匹配（DW-FM）框架，通过重加权速度回归目标对齐下游决策遗憾。理论证明通过损失诱导的决策差异和伴随传输论证，下界遗憾可关联到路径速度不匹配。在合成投资组合、半真实金融和交通CVaR三个基准上，DW-FM相比标准流匹配显著降低下游遗憾。

论文 DW-FM Flow Matching CVaR 上下文随机优化决策遗憾

推荐理由：这篇论文给出了一个训练生成模型的新思路——DW-FM，专门优化下游决策效果，在CVaR任务上比普通流匹配更好用。

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月19日

10:02

10:02

arXiv cs.AI@Chenrui Ma, Xi Xiao, Lin Zhao, Tianyang Wang, Ferdinando Fioretto, Yanning Shen

精选

Drift Flow Matching (DFM) 提出了一种新框架，将高效的 Drift 模型（单步生成）与 Flow Matching（多步迭代生成）结合起来。DFM 保留了直接传输映射的效率，同时允许通过多步推理来优化生成质量，从而在计算成本与生成质量之间灵活权衡。实验表明，DFM 在多个任务和数据集上均有效，为生成模型提供了新的自适应采样范式。

论文生成模型 Flow Matching Drift 模型推理扩展采样效率

推荐理由：做生成模型研究的开发者终于有了一个既能高效单步生成、又能按需多步精调的框架——DFM 解决了 Drift 模型缺乏推理扩展性的痛点，值得关注其在不同场景下的灵活应用。

5月18日

10:30

10:30

arXiv cs.LG@Shuchan Wang

精选

研究人员提出了一种新的生成模型水印方法，将水印直接嵌入到Flow Matching模型的连续动态（速度场）中，而非模型权重或输出。该方法通过随机编码在训练时添加密钥相关的扰动，检测时从黑盒查询中恢复信息，且不改变生成分布。在MNIST和CIFAR-10上的实验表明，该方法能可靠恢复水印，保持生成质量，且无密钥时解码准确率仅为随机水平。

论文水印 Flow Matching 生成模型版权保护随机编码

推荐理由：这项研究解决了生成模型版权保护的核心难题——水印不可篡改且不影响生成质量，做AI安全或模型部署的团队值得关注，可以直接参考其黑盒检测方案。

5月11日

11:42

11:42arXiv cs.AI（学术论文）

精选80°

Flow-OPD提出首个将在线策略蒸馏（OPD）集成到Flow Matching模型中的统一后训练框架，有效解决了多任务对齐中的奖励稀疏和梯度干扰问题。该框架采用两阶段对齐策略：先通过单奖励GRPO微调培养领域专用教师模型，再通过Flow冷启动、在线策略采样、任务路由标注和密集轨迹监督将异构专业知识整合到单个学生模型中。研究者还引入了流形锚点正则化（MAR），利用任务无关教师提供全数据监督，避免RL驱动对齐中常见的美学退化。在Stable Diffusion 3.5 Medium上的实验显示，GenEval分数从63提升至92，OCR准确率从59%提升至94%，整体提升约10个百分点，且保持图像保真度和人类偏好对齐，并出现“超越教师”效应。该工作为构建通用文本到图像模型的可扩展对齐范式奠定了基础。

论文图像生成 Flow Matching 在线策略蒸馏多任务对齐 Stable Diffusion 3.5

推荐理由：该工作针对现有多任务对齐中指标相互制约和奖励欺骗的痛点，将LLM领域成熟的OPD方法成功迁移至图像生成领域，并通过冷启动、任务路由和正则化创新提升了效果。实验在关键指标上大幅领先现有方法，对业界构建高性能通用文生图模型具有直接参考价值。