精选理由
用隐藏目标解决库存优化,有理论保证
该论文提出一种隐藏目标学习方法用于在线库存优化(OIO),其中基础学习器使用在线梯度下降(OGD)。该方法将已知的遗憾保证从对公共需求概率的逆依赖提升为逆平方根依赖,并证明了匹配下界。对于强凸损失,该方法首次给出poly对数遗憾保证;对于一般凸集,该方法实现了第一个适应欧几里得路径变化的动态遗憾保证。实验在合成和真实库存数据上验证了理论结果。
AI 翻译 · 中文
该论文提出一种隐藏目标学习方法用于在线库存优化(OIO),其中基础学习器使用在线梯度下降(OGD)。该方法将已知的遗憾保证从对公共需求概率的逆依赖提升为逆平方根依赖,并证明了匹配下界。对于强凸损失,该方法首次给出poly对数遗憾保证;对于一般凸集,该方法实现了第一个适应欧几里得路径变化的动态遗憾保证。实验在合成和真实库存数据上验证了理论结果。
Online inventory optimization (OIO) is online convex optimization with physical memory: inventory carryover makes the feasible action set depend on the past. A natural principle, used in stochastic inventory learning and…