6月23日
10:43
10:43arXiv cs.LG@Milton Mondal, Sushovan Chanda, Mohamad Mahdi Alawieh, Brijesh Sukhadiya, Donatus Krah, Clinton Gonsalves, Antonios Ntolkeras, Silvio O. Rizzoli, Ali H. Shaib
标准Pauli测量下量子神经网络输出被约束在[-1,1]区间,导致交叉熵损失对logit差异敏感度不足,梯度被抑制。本文首次将这一效应定义为测量诱导logit收缩。提出可学习的量子测量温度(QMT)参数,在损失函数之前重新缩放量子测量输出,补偿物理测量范围限制。QMT不改变量子电路结构或测量算子。在荧光显微图像与六类Fashion MNIST实验中,QMT一致提升了logit分离度、梯度强度和训练稳定性,并提高了分类准确率。
推荐理由:这篇论文找到了混合量子神经网络训练不稳定的一个隐藏原因——测量值范围太小,并提出了一个简单的可学习缩放参数QMT来解决。实验在蛋白质分类和Fashion MNIST上都有效果。