论文精选

Divide et Calibra:通过向量量化实现多类局部校准

Divide et Calibra: Multiclass Local Calibration via Vector Quantization

精选理由

做高可靠性机器学习模型(如医疗、金融)的团队,终于有了一个能兼顾全局和局部校准的实用方法——VQ分区加参数共享的设计让校准更精准,建议做模型可靠性的开发者点开看看具体实现。

AI 摘要

该论文提出了一种基于向量量化(VQ)的多类校准方法,解决了全局校准假设误差均匀分布和局部校准因降维导致信息丢失的问题。方法通过VQ对表示空间进行结构化分区,并利用共享码字依赖因子构建区域特定的校准映射,同时引入狄利克雷浓度的索引参数化实现跨区域参数共享。实验表明,该方法在保持全局校准和预测性能的同时,显著提升了局部校准效果,尤其适用于稀疏区域。

AI 翻译 · 中文

该论文提出了一种基于向量量化(VQ)的多类校准方法,解决了全局校准假设误差均匀分布和局部校准因降维导致信息丢失的问题。方法通过VQ对表示空间进行结构化分区,并利用共享码字依赖因子构建区域特定的校准映射,同时引入狄利克雷浓度的索引参数化实现跨区域参数共享。实验表明,该方法在保持全局校准和预测性能的同时,显著提升了局部校准效果,尤其适用于稀疏区域。

arXiv cs.AIAccurate and well-calibrated Machine Learning (ML) models are mandatory in high-stakes settings, yet effective multiclass calibration remains challenging: global approaches assume calibration errors are homogeneous acros