棒球投球序列的反事实优化及其对赛季级统计指标影响的估计

arXiv cs.LG 2026/06/17 04:00 论文

baseball sports-analytics pitch-sequencing transformer machine-learning counterfactual optimization

摘要

本文利用基于Transformer的模型对MLB Statcast数据进行反事实优化，发现同时优化最终投球和准备投球可以使K/9等赛季级统计指标提高超过1.0。

arXiv:2606.17345v1 公告类型：新摘要：尽管投球序列是棒球分析中的核心话题，但以往研究主要集中于优化单个打席中的最终投球，而对前置准备投球的作用及其对长期赛季级表现的影响探讨不足。为解决这些问题，本研究利用MLB Statcast数据进行了反事实分析。训练了一个基于Transformer的机器学习模型，用于预测目标投球是否会导致场内结果或挥空。随后，通过用替代投球类型和位置替换最终投球或前置准备投球，同时保持周围情境信息不变，生成反事实投球序列。最优反事实选择被定义为使预测的场内概率最小化的投球，并通过将模型输出与赛季统计指标关联的回归模型来估计其对投手赛季统计指标的预期影响。结果表明，同时优化最终投球和准备投球可能显著影响赛季级表现，包括K/9提高超过1.0。分析还提供了若干实用见解，包括特定速度区间的有效位置、投球指令的重要性以及通过中速投球扩展投球选择选项。这些发现定量支持了投球序列在棒球中的战略重要性。

查看原文

查看缓存全文

缓存时间: 2026/06/17 05:37

# 棒球投球序列的反事实优化及其对赛季统计指标影响的估计
来源：https://arxiv.org/abs/2606.17345  
查看PDF（https://arxiv.org/pdf/2606.17345）

> **摘要：** 尽管投球序列是棒球数据分析的核心议题，以往研究主要集中于优化单次打席中的最后一球，而对前置配球的作用及其对长期赛季水平表现的影响关注不足。为解决这些问题，本研究利用MLB Statcast数据进行了反事实分析。训练了一个基于Transformer的机器学习模型，用于预测目标投球是否会导致击球进场或挥棒出局的结果。通过将最后一球或前置配球替换为替代的球种和位置（同时保持周边情境信息不变），生成了反事实投球序列。最优反事实选择被定义为那些能够最小化预测击球进场概率的选择，并利用将模型输出与赛季统计数据关联的回归模型，估算了这些选择对投手赛季统计指标的预期影响。结果表明，对最后一球和前置配球的优化都可能显著影响赛季水平表现，包括K/9提升超过1.0。分析还提供了若干实用洞见，包括特定速度区间的有效位置、投球命令的重要性，以及通过中速球扩展球种选择范围。这些发现定量支持了棒球中投球序列的战略重要性。

## 提交历史

来自：Ryota Takamido \[查看邮箱（https://arxiv.org/show-email/b7a09756/2606.17345）\] **\[v1\]**  
2026年6月15日星期一 22:47:06 UTC（2,531 KB）

棒球投球序列的反事实优化及其对赛季级统计指标影响的估计

相似文章

基于自回归序列模型的条件属性估计

基于轨迹的数据归因的可靠性如何？误差来源、修复方法及实践指南

SkillOpt 将 markdown 技能文件视为可训练参数并配备适当的优化机制

交易前规划：面向RL交易代理的推理时优化

@Yif_Yang: 介绍 SkillOpt — 一个面向智能体技能的优化器。不再微调模型权重，而是将自然语言…

提交意见反馈