11:37arXiv cs.AI@Andrew Kang, Priya Narasimhan精选该研究将足球传球评估重新定义为蒙特卡洛树搜索(MCTS)问题,利用已有的价值模型、世界模型和反事实动作策略。基于德甲首个公开高保真3D球轨迹数据集,提出Monte Carlo Pass Search(MCPS),为每个观察到的传球推断踢球参数,采样执行变体和选项变体,用球条件世界模型滚动预测至下一次触球,并通过学习到的价值模型评分获得价值分布。该分布支持两种互补的执行盈余分数(基于均值和百分位数)用于分析和排名。为在有限公开数据下提高世界模型样本效率,改编了自动驾驶领域的离散令牌自回归轨迹生成器(SMART),在最佳20次预测准确率上优于基线,并支持完全假设性滚动用于下游评估。已发布模型检查点和代码。论文蒙特卡洛树搜索足球分析3D轨迹反事实评估开源/仓库推荐理由:足球数据分析团队终于有了可落地的3D传球评估工具——MCPS用MCTS框架量化每次传球的执行盈余,做战术分析或球员评估的可以直接用开源代码和模型。原文
10:02arXiv cs.LG@Matthias Cosler, Cas Cremers, Bernd Finkbeiner, Mohamed Ghanem, Niklas Medinger本文提出一个基于强化学习的框架,借鉴AlphaZero和AlphaProof的思路,为安全协议分析工具Tamarin实现新的证明搜索方式。该框架通过无状态API将Tamarin转化为经典RL环境,并用蒙特卡洛树搜索结合神经网络启发式,从已完成子证明中学习。在16个案例研究中,该方法比Tamarin标准搜索找到更多自动证明,且生成的证明比标准及人工设计的启发式更短。该框架可直接用于辅助Tamarin用户,减少人工工作量,展示了RL方法在协议验证领域的潜力。论文强化学习安全协议验证Tamarin蒙特卡洛树搜索自动证明推荐理由:做安全协议验证的团队终于有了减少人工的利器——RL框架自动生成更短证明,Tamarin用户可以直接集成到现有工作流中,值得一试。原文