10:38arXiv cs.LG@Kamar Hibatallah Baghdadi, Kawther Guoual Belhamidi, Sara Belhadj, Aissa Boulmerka, Nadir FarhiHiReLC是一个分层集成强化学习框架,用于深度神经网络的自动联合量化与结构化剪枝。低层智能体按块独立选择位宽、剪枝保留比、量化类型和粒度,高层智能体基于Fisher信息估计协调全局预算分配。框架使用轻量MLP代理进行奖励塑造,降低策略评估成本。在Vision Transformer和CNN基准上,实现参数存储压缩比5.99-6.72倍,一个设定下准确率提升3.83%,其他设定准确率下降0.55-5.62%。论文HiReLCVision TransformerCNN剪枝量化推荐理由:这个框架能自动给神经网络做剪枝和量化,压缩比达到6倍多,准确率几乎不掉,适合做模型部署。原文