机器学习与随机游走难题:使用扩展窗口评估和SHAP可解释性预测加元/美元汇率
摘要
本文研究机器学习模型能否在预测美元/加元汇率方面击败随机游走基准,发现只有线性回归在统计上优于朴素模型,SHAP分析显示短期滞后项主导预测。
arXiv:2606.15058v1 Announce Type: new
摘要:本研究考察机器学习(ML)模型能否在预测月度美元/加元汇率方面优于朴素随机游走基准。使用加拿大银行2017年1月至2026年5月的日度数据,重采样为113个月度观测值,评估了五种ML模型:线性回归、随机森林、梯度提升、XGBoost和AdaBoost。这些模型以朴素随机游走模型和带有Holt-Winters季节性的指数平滑(ETS)为基准进行对比。所有模型均使用扩展窗口框架进行评估,以保持严格的样本外完整性,并使用Diebold-Mariano(DM)检验评估预测精度差异。结构性断点检测识别出序列中的四个显著断点,分别对应2018年中美贸易战升级、2020年COVID-19经济复苏、2022年加拿大银行加息周期峰值以及2024年加拿大银行降息周期开始。应用SHAP(Shapley Additive Explanations)分析来解释表现最佳ML模型的驱动因素。结果表明,朴素随机游走模型仍然是一个强大的基准。线性回归是唯一在统计上优于朴素随机游走模型的模型,DM统计量为3.0585,p值为0.0071,而ML集成模型仅表现出微小差异。使用扩展窗口框架的随机森林在所有模型中(除随机游走外)实现了最低的MAPE,为1.17%。SHAP分析证实,短期滞后项(尤其是lag1和lag2)以及近期滚动均值主导预测,这与汇率的近似随机游走行为一致。
查看缓存全文
缓存时间: 2026/06/16 11:37
# 机器学习与随机游走谜题:基于扩展窗口评估与SHAP可解释性的加元/美元汇率预测 来源:https://arxiv.org/abs/2606.15058 查看PDF(https://arxiv.org/pdf/2606.15058) > 摘要:本研究探讨机器学习模型能否在月度美元/加元汇率预测中超越朴素随机游走基准。研究使用加拿大银行2017年1月至2026年5月的日度数据,重采样为113个月度观测值,评估了五种机器学习模型:线性回归、随机森林、梯度提升、XGBoost和AdaBoost。这些模型以朴素随机游走模型以及带Holt-Winters季节性的指数平滑(ETS)为基准。所有模型均采用扩展窗口框架进行评估,以保持严格的样本外完整性,并使用Diebold-Mariano(DM)检验评估预测精度差异。结构断点检测识别出序列中四个显著断点,分别对应于2018年中美贸易战升级、2020年新冠疫情经济复苏、2022年加拿大银行加息周期高峰,以及2024年加拿大银行降息周期开始。SHAP(Shapley Additive Explanations)分析用于解释最优表现ML模型的驱动因素。结果表明,朴素随机游走模型仍是一个强大的基准。线性回归是唯一在统计上优于朴素随机游走模型的模型,其DM统计量为3.0585,p值为0.0071,而ML集成模型仅表现出微小差异。在除随机游走外的所有模型中,采用扩展窗口框架的随机森林实现了最低的MAPE(1.17%)。SHAP分析证实,短期滞后(尤其是lag1和lag2)以及近期滚动均值主导了预测,这与汇率接近随机游走的行为一致。 ## 提交历史 来自:Edmund Agyemang \[查看邮件(https://arxiv.org/show-email/e13c952d/2606.15058)\] **\[v1\]**2026年6月13日星期六 02:13:18 UTC(1,675 KB)
相似文章
预测中期阿尔茨海默病进展:基于ADNI临床和生物标志物历史数据实现24个月CDR-SB变化的残差间隙感知变换器
本文提出了一种残差间隙感知变换器,将混合效应统计参考与基于变换器的残差学习相结合,利用ADNI临床和生物标志物历史数据预测24个月CDR-SB变化,在均方误差和相关性上均优于基线模型。
AI-Trader:在实时金融市场中对自主智能体进行基准测试
本文介绍了 AI-Trader,这是首个用于评估大语言模型(LLMs)在美股、A股和加密货币等金融决策方面的全自动实时基准测试平台。研究指出,通用智能并不必然保证交易成功,并强调了在自主智能体中风险控制的重要性。
使用XAI分析欧洲电力市场的驱动因素与相互依存关系
本文应用可解释人工智能技术(SHAP、SSHAP)于深度神经网络模型,分析39个欧洲竞价区域的电价驱动因素,发现尽管太阳能发电份额较低,但太阳能与天然气价格仍是关键驱动因素。
利用深度学习进行具有不确定性意识的阿尔茨海默病进展纵向预测
本文提出了一种概率框架,用于阿尔茨海默病进展预测,该框架结合了有序诊断预测、多时间点轨迹生成和分解不确定性估计,采用 Temporal Fusion Transformer 编码器和自回归混合密度网络。在ADNI数据上,该模型优于基线,实现了接近标称的90%可信区间覆盖率,并提供了具有临床意义的不确定性信号。
算法度量学:算法反馈下的预测
本文介绍了算法度量学(algometrics),一个在算法反馈下进行时间序列预测的框架,证明了部署风险与历史风险不同,且无法仅从被动数据中识别。它提供了通过干预或随机化行动来估计部署风险的方法。