11:10arXiv cs.LG@Anthony Pineci, Yunzong Xu该论文提出一种隐藏目标学习方法用于在线库存优化(OIO),其中基础学习器使用在线梯度下降(OGD)。该方法将已知的遗憾保证从对公共需求概率的逆依赖提升为逆平方根依赖,并证明了匹配下界。对于强凸损失,该方法首次给出poly对数遗憾保证;对于一般凸集,该方法实现了第一个适应欧几里得路径变化的动态遗憾保证。实验在合成和真实库存数据上验证了理论结果。论文OIO在线梯度下降库存优化凸集在线凸优化推荐理由:用隐藏目标解决库存优化,有理论保证原文
10:22arXiv cs.LG@Dhruv Sarkar, Abhishek Sinha精选本文针对对抗性约束下的在线凸优化(COCO)问题,提出了一种基于投影的简单算法。对于强凸损失,该算法同时实现了 O(log T) 的遗憾和 O(log T) 的累积约束违反(CCV),相比此前最优的 O(√T log T) CCV 实现了指数级改进。对于凸损失,算法将 CCV 从 O(√T log T) 降至 O(√T),同时保持最优 O(√T) 遗憾。关键创新在于利用自收缩曲线的几何结果,该技术可能具有独立研究价值。论文在线凸优化约束优化自收缩性遗憾分析投影算法推荐理由:约束在线优化是机器学习中的核心问题,这篇论文用简洁的投影算法大幅降低了累积约束违反,做在线学习或凸优化理论的研究者值得关注,其自收缩性技巧可能启发更多改进。原文