棒球投球序列的反事实优化及其对赛季级统计指标影响的估计
摘要
本文利用基于Transformer的模型对MLB Statcast数据进行反事实优化,发现同时优化最终投球和准备投球可以使K/9等赛季级统计指标提高超过1.0。
arXiv:2606.17345v1 公告类型:新
摘要:尽管投球序列是棒球分析中的核心话题,但以往研究主要集中于优化单个打席中的最终投球,而对前置准备投球的作用及其对长期赛季级表现的影响探讨不足。为解决这些问题,本研究利用MLB Statcast数据进行了反事实分析。训练了一个基于Transformer的机器学习模型,用于预测目标投球是否会导致场内结果或挥空。随后,通过用替代投球类型和位置替换最终投球或前置准备投球,同时保持周围情境信息不变,生成反事实投球序列。最优反事实选择被定义为使预测的场内概率最小化的投球,并通过将模型输出与赛季统计指标关联的回归模型来估计其对投手赛季统计指标的预期影响。结果表明,同时优化最终投球和准备投球可能显著影响赛季级表现,包括K/9提高超过1.0。分析还提供了若干实用见解,包括特定速度区间的有效位置、投球指令的重要性以及通过中速投球扩展投球选择选项。这些发现定量支持了投球序列在棒球中的战略重要性。
查看缓存全文
缓存时间: 2026/06/17 05:37
# 棒球投球序列的反事实优化及其对赛季统计指标影响的估计 来源:https://arxiv.org/abs/2606.17345 查看PDF(https://arxiv.org/pdf/2606.17345) > **摘要:** 尽管投球序列是棒球数据分析的核心议题,以往研究主要集中于优化单次打席中的最后一球,而对前置配球的作用及其对长期赛季水平表现的影响关注不足。为解决这些问题,本研究利用MLB Statcast数据进行了反事实分析。训练了一个基于Transformer的机器学习模型,用于预测目标投球是否会导致击球进场或挥棒出局的结果。通过将最后一球或前置配球替换为替代的球种和位置(同时保持周边情境信息不变),生成了反事实投球序列。最优反事实选择被定义为那些能够最小化预测击球进场概率的选择,并利用将模型输出与赛季统计数据关联的回归模型,估算了这些选择对投手赛季统计指标的预期影响。结果表明,对最后一球和前置配球的优化都可能显著影响赛季水平表现,包括K/9提升超过1.0。分析还提供了若干实用洞见,包括特定速度区间的有效位置、投球命令的重要性,以及通过中速球扩展球种选择范围。这些发现定量支持了棒球中投球序列的战略重要性。 ## 提交历史 来自:Ryota Takamido \[查看邮箱(https://arxiv.org/show-email/b7a09756/2606.17345)\] **\[v1\]** 2026年6月15日星期一 22:47:06 UTC(2,531 KB)
相似文章
基于自回归序列模型的条件属性估计
本文介绍了条件属性变换器(Conditional Attribute Transformers),一种联合估计条件概率和属性值的方法,能够在单次前向传播中实现信用分配、反事实分析和可引导生成。
基于轨迹的数据归因的可靠性如何?误差来源、修复方法及实践指南
本文首次系统性地分析了基于轨迹的数据归因方法的误差来源,指出优化器不匹配是主要误差,提出了AdamW-influence来解决该问题,并通过K步前瞻框架提供了数据选择的实用指南。
SkillOpt 将 markdown 技能文件视为可训练参数并配备适当的优化机制
一篇新论文通过将 markdown 技能文件视为可训练参数并使用经过保留集验证的有界编辑,将智能体的技能优化形式化。该方法在不同模型间迁移良好,并提升了程序化基准测试的性能。
交易前规划:面向RL交易代理的推理时优化
FPILOT是一个用于RL交易代理的插件式推理时优化框架,它利用价格预测而无需重新训练,在TradeMaster DJ30基准上实现了收益和风险调整指标的一致改进。
@Yif_Yang: 介绍 SkillOpt — 一个面向智能体技能的优化器。不再微调模型权重,而是将自然语言…
介绍 SkillOpt,一个将自然语言技能视为可训练外部参数而非微调模型权重的优化器。它通过有界编辑和验证门控实现稳定、可控的技能更新,在 7 个模型的 6 个基准测试的 52 个设置中取得最佳或并列最佳结果。