全部 AI 动态 · AI 热点

6月16日

20:46

AITOP6月16日 20:46

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

600亿美元买下Cursor，xAI终于拿到了编程工具，但真正值得跟踪的或许不是AI

6月12日

12:57

AITOP6月12日 12:57

Claude代码里藏了个20260612，18个月后的AI记忆革命已经开始倒计时

6月11日

15:28

AITOP6月11日 15:28

1107 vs 303：谷歌悄悄开源了一个“拆打字机”的模型，把大模型速度翻了4倍

15:23

AITOP6月11日 15:23

DiffusionGemma颠覆文本生成？自回归模型的“统治”要结束了

15:07

AITOP6月11日 15:07

每秒1107个token，Google开源的扩散模型为什么能改变本地推理格局？

5月26日

11:45

11:45

arXiv cs.AI@Wei Song, Tianhang Wang, Yitong Chen, Tong Zhang, Zuxuan Wu, Ming Li, Jiaqi Wang, Kaicheng Yu

精选

本文提出通道级向量量化（CVQ），一种全新的图像标记化范式，将传统基于空间分块的标记方式改为对特征图每个通道进行量化。基于CVQ，作者构建了通道级自回归（CAR）模型，采用“下一通道预测”策略，模拟人类艺术家先画轮廓再细化细节的创作流程。实验表明，CVQ在16K+码本大小下实现100%码本利用率，显著提升重建质量；CAR在DPG和GenEval指标上分别达到86.7和0.79，在文本到图像生成任务中表现强劲。这一工作为视觉自回归模型提供了新思路，有望推动图像生成效率与质量的双重提升。

论文图像生成向量量化自回归模型文本到图像视觉细节

推荐理由：CVQ解决了传统VQ码本利用率低、细节丢失的痛点，做图像生成和视觉自回归研究的开发者值得关注——它让模型像人类一样先画轮廓再细化，生成质量更高。

5月21日

09:46

09:46

arXiv cs.AI@Cesare Barbera, Lorenzo Perini, Giovanni De Toni, Andrea Passerini, Andrea Pugnana

精选

该论文提出了一种基于向量量化（VQ）的多类校准方法，解决了全局校准假设误差均匀分布和局部校准因降维导致信息丢失的问题。方法通过VQ对表示空间进行结构化分区，并利用共享码字依赖因子构建区域特定的校准映射，同时引入狄利克雷浓度的索引参数化实现跨区域参数共享。实验表明，该方法在保持全局校准和预测性能的同时，显著提升了局部校准效果，尤其适用于稀疏区域。

论文多类校准向量量化局部校准机器学习可靠性参数共享

推荐理由：做高可靠性机器学习模型（如医疗、金融）的团队，终于有了一个能兼顾全局和局部校准的实用方法——VQ分区加参数共享的设计让校准更精准，建议做模型可靠性的开发者点开看看具体实现。