精选理由
这个框架能自动给神经网络做剪枝和量化,压缩比达到6倍多,准确率几乎不掉,适合做模型部署。
HiReLC是一个分层集成强化学习框架,用于深度神经网络的自动联合量化与结构化剪枝。低层智能体按块独立选择位宽、剪枝保留比、量化类型和粒度,高层智能体基于Fisher信息估计协调全局预算分配。框架使用轻量MLP代理进行奖励塑造,降低策略评估成本。在Vision Transformer和CNN基准上,实现参数存储压缩比5.99-6.72倍,一个设定下准确率提升3.83%,其他设定准确率下降0.55-5.62%。
AI 翻译 · 中文
HiReLC是一个分层集成强化学习框架,用于深度神经网络的自动联合量化与结构化剪枝。低层智能体按块独立选择位宽、剪枝保留比、量化类型和粒度,高层智能体基于Fisher信息估计协调全局预算分配。框架使用轻量MLP代理进行奖励塑造,降低策略评估成本。在Vision Transformer和CNN基准上,实现参数存储压缩比5.99-6.72倍,一个设定下准确率提升3.83%,其他设定准确率下降0.55-5.62%。
We present HiReLC, a hierarchical ensemble-reinforcement learning framework for automated joint quantization and structured pruning of deep neural networks. The framework decomposes the compression search across two leve…