11:45arXiv cs.AI@Wei Song, Tianhang Wang, Yitong Chen, Tong Zhang, Zuxuan Wu, Ming Li, Jiaqi Wang, Kaicheng Yu精选本文提出通道级向量量化(CVQ),一种全新的图像标记化范式,将传统基于空间分块的标记方式改为对特征图每个通道进行量化。基于CVQ,作者构建了通道级自回归(CAR)模型,采用“下一通道预测”策略,模拟人类艺术家先画轮廓再细化细节的创作流程。实验表明,CVQ在16K+码本大小下实现100%码本利用率,显著提升重建质量;CAR在DPG和GenEval指标上分别达到86.7和0.79,在文本到图像生成任务中表现强劲。这一工作为视觉自回归模型提供了新思路,有望推动图像生成效率与质量的双重提升。论文图像生成向量量化自回归模型文本到图像视觉细节推荐理由:CVQ解决了传统VQ码本利用率低、细节丢失的痛点,做图像生成和视觉自回归研究的开发者值得关注——它让模型像人类一样先画轮廓再细化,生成质量更高。原文
09:46arXiv cs.AI@Cesare Barbera, Lorenzo Perini, Giovanni De Toni, Andrea Passerini, Andrea Pugnana精选该论文提出了一种基于向量量化(VQ)的多类校准方法,解决了全局校准假设误差均匀分布和局部校准因降维导致信息丢失的问题。方法通过VQ对表示空间进行结构化分区,并利用共享码字依赖因子构建区域特定的校准映射,同时引入狄利克雷浓度的索引参数化实现跨区域参数共享。实验表明,该方法在保持全局校准和预测性能的同时,显著提升了局部校准效果,尤其适用于稀疏区域。论文多类校准向量量化局部校准机器学习可靠性参数共享推荐理由:做高可靠性机器学习模型(如医疗、金融)的团队,终于有了一个能兼顾全局和局部校准的实用方法——VQ分区加参数共享的设计让校准更精准,建议做模型可靠性的开发者点开看看具体实现。原文