高效条件化:伪观测批量贝叶斯优化为何有效及何时失效
摘要
本文为伪观测批量贝叶斯优化提供了一个统一的理论框架,证明了高斯过程(Gaussian processes)能产生不同的批量点,并且像Constant Liar和Kriging Believer这样的常见方法是一个单一条件化机制的实例。它引入了结构多样性诊断(SDD)来测试代理模型兼容性,并在多个基准函数和超参数调优中验证了预测结果。
arXiv:2605.18819v1 公告类型:新
摘要:Constant Liar (CL)、Kriging Believer (KB) 和 fantasy 模型广泛用于并行贝叶斯优化中的批量选择,但一直缺乏一个统一的理论来解释它们的有效性及失败条件。我们识别出高效条件化(efficient conditioning)是关键代理模型属性——即在数据扩充时能够以封闭形式更新预测的能力。我们证明高斯过程(Gaussian Processes)满足这一要求,能产生阶数为l的可证明不同的批量点,并且这对任何在后验不确定性上单调非递减的采集函数(EI, UCB, PI)都成立,而Thompson Sampling具有定性相似的行为。我们将CL、KB和fantasy模型统一为单一条件化机制的实例,仅在于谎言值分布(lie value distribution)不同,并与局部惩罚(LP)建立定量联系,与行列式点过程(DPPs)建立定性联系。为了将模型结构与优化器随机性分开,我们引入了结构多样性诊断(SDD),这是一种可重用的测试代理模型兼容性的方法论。在Hartmann6D、Ackley 8D、Levy10D和SVM超参数调优上的实验验证了所有理论预测:CL或KB的隐式惩罚匹配或超越显式LP;贪婪条件化收敛与联合qEI相当;高效条件化扩展到Multiquadric RBF网络;而参数代理模型即使完全重新训练(如随机森林)也会产生退化批量,神经网络只有以GP条件化15倍的实时开销才能恢复多样性。在多个初始数据集和观测噪声下验证了鲁棒性。
相似文章
基于后验混合贝叶斯信念的正则化离线策略优化
本文介绍了后验混合贝叶斯信念(PhyB),这是一个将贝叶斯强化学习中的期望重新表述为动力学模型的凸组合的框架,从而能够实现具有有界目标差异和最新性能的高效正则化离线策略优化。
面向理解高维贝叶斯优化的自动化核发现
论文介绍了Kernel Discovery,这是一个LLM驱动的进化框架,用于高维贝叶斯优化,它搜索更广泛的核空间并在基准测试上取得了最先进的结果。
当行列式不够用时:私有稀有切换
本笔记分享了一个研究瞬间,Codex 帮助找到了私有线性赌博机中一种新的稀有切换规则,利用广义瑞利商克服了因高斯噪声导致的行列式单调性失效问题。
用于离策略时序差分预测的行为感知辅助修正
本文提出用于离策略时序差分预测的行为感知辅助修正,引入了BA-TDC和BA-TDRC算法,这些算法用行为贝尔曼矩阵替代辅助协方差矩阵,以提高稳定性和收敛性。理论分析和在标准基准上的实验验证了所提方法的有效性。
驾驭极端 Token:基于高斯核优势重权重的协方差感知 GRPO
本文提出了一种协方差感知的组相对策略优化(GRPO)变体,该方法利用高斯核优势重权重技术来稳定训练熵,并提升大语言模型的推理性能。