超越单槽位:多槽位保量展示广告的联合优化
摘要
提出了一种针对多槽位保量展示广告的联合优化框架,通过二分图匹配和合约轮盘机制解决槽位冗余和合约不平衡问题。在美团上的在线A/B测试显示,收入与合约履行显著提升。
arXiv:2605.21556v1 公告类型:新
摘要:保量展示广告对平台变现至关重要,然而现有方法通常基于单槽位假设,限制了其在多槽位页面浏览中优化分配的能力。本文提出了一种新颖的多槽位GD分配联合优化框架,解决了槽位冗余、合约不平衡和曝光集中等关键挑战。我们的方法将分配问题建模为离线二分图匹配问题,结合合约轮盘机制实现槽位独占以及页面浏览量约束进行曝光控制,并融入可扩展的分配优化算法以实现高效的大规模部署。在美团广告平台上的大量在线测试表明,我们的方法显著提升了商家ROI、平台收入效率和合约履行鲁棒性。具体而言,在线A/B测试显示,在70%流量下每用户平均收入(ARPU)提升了28.99%,DID分析进一步表明合约稳定性得到改善,证明了我们的框架在实际广告部署中具有很强的适用性和有效性。
查看缓存全文
缓存时间: 2026/05/22 08:48
# 超越单一槽位:面向多槽位保量展示广告的联合优化
来源:https://arxiv.org/html/2605.21556
\(2026\)
###### 摘要.
保量展示广告对平台变现至关重要,然而现有方法通常基于单槽位假设,限制了其在多槽位页面浏览场景下优化分配的能力。本文提出了一种新颖的面向多槽位保量展示(GD)分配联合优化框架,解决了槽位级冗余、合约失衡和曝光集中等关键挑战。我们的方法将分配问题建模为离线二分图匹配,并引入合同轮盘机制实现槽位独占性,以及页面浏览约束来控制曝光量,同时包含一个可扩展的分配优化算法以支持大规模高效部署。在美团广告平台上进行的大量线上测试表明,我们的方法显著提升了商家ROI、平台收入效率和合约交付稳健性。具体来说,线上A/B测试显示,在70%流量下,每用户平均收入(ARPU)提升了28.99%,双重差分(DID)分析进一步表明合约稳定性得到改善,证明了我们的框架在实际广告部署中的强大适用性和有效性。
保量展示广告, 约束优化, 合同轮盘
††copyright:acmlicensed††journalyear:2026††conference:第49届国际ACM SIGIR信息检索研究与发展大会; 2026年7月20–24日; 美国纽约州伍德斯托克††journalyear:2026††copyright:cc††conference:第49届国际ACM SIGIR信息检索研究与发展大会论文集; 2026年7月20–24日; 澳大利亚维多利亚州墨尔本††booktitle:第49届国际ACM SIGIR信息检索研究与发展大会论文集(SIGIR '26),2026年7月20–24日,澳大利亚墨尔本††doi:10.1145/3805712.3808398††isbn:979-8-4007-2599-9/2026/07††ccs:信息系统††ccs:信息系统 计算广告
## 1. 引言
在保量展示(GD)广告中,主流方法主要基于单槽位建模假设,即每个广告合约独立针对特定槽位进行优化,以最大化点击率(CTR)和支付转化率(CVR)等参与度指标(Hojjat 等,2014 (https://arxiv.org/html/2605.21556#bib.bib4);Fang 等,2019 (https://arxiv.org/html/2605.21556#bib.bib3);Lei 等,2020 (https://arxiv.org/html/2605.21556#bib.bib5))。虽然在广告位较为简单的早期场景中有效,但此类方法对于美团、淘宝等现代平台日益不足——单个页面可能包含多个广告位,每次页面浏览可能触发多个槽位的同步曝光,使得独立的槽位优化无法捕捉复杂的分配动态。
尽管近期工作(Mao 等,2023 (https://arxiv.org/html/2605.21556#bib.bib12);Li 等,2024 (https://arxiv.org/html/2605.21556#bib.bib11))引入了粗粒度的供给端约束以防止超量投放,但缺乏精细的槽位级控制,导致少数高优先级合约可能独占优质位置。此外,多数系统依赖线上贪心分配(Dai 等,2024 (https://arxiv.org/html/2605.21556#bib.bib2);Lei 等,2025 (https://arxiv.org/html/2605.21556#bib.bib13)),孤立地做出槽位级决策。因此,现有方法仍不足以确保跨多槽位的公平性、曝光多样性和稳定投放。
尽管在提升交付和点击效果方面有效,主流的GD方法(如 AUAF (Cheng 等,2022 (https://arxiv.org/html/2605.21556#bib.bib1)))在实际多槽位环境中暴露出关键局限:(1) **缺乏跨广告位的协同**:多数现有方法采用基于单槽位视图的局部建模方式,每一步优化仅考虑一个广告位与多个合约之间的分配。这种局部策略可能导致热门槽位过度使用而其他槽位利用不足,降低整体投放效率。(2) **合约曝光无上限**:多数方法确保每个合约的最小投放量,但未限制合约可获取的最大曝光次数。结果,高优先级合约可能独占优质曝光,导致不公平和失衡的分配。(3) **同一页面冗余曝光**:请求级独占性无法阻止同一合约在单个页面的多个槽位出现,导致重复曝光并降低用户体验。
为解决上述局限,我们提出了一种基于离线二分图匹配的联合优化框架,专为多槽位GD分配定制。我们的方法从根本上超越了传统单槽位范式,通过全局离线优化过程,在页面浏览级别对广告合约与多个广告位之间的分配进行建模,从而实现协作决策,增强了平衡性、公平性和多样性。我们进一步引入页面浏览(PV)约束以限制每个槽位的曝光量,防止头部槽位过度使用,促进流量平衡分配。此外,我们引入了一种基于合同轮盘的独占性机制,确保每个合约在每个页面最多出现于一个槽位,从而减少冗余曝光并改善用户体验。我们的主要贡献如下:
- •我们提出了一个统一的联合优化框架,将合约-槽位分配问题建模为页面浏览级别的离线二分图匹配任务,实现了全局协调的高效交付。
- •我们引入了两个面向工业部署的实用模块:(i) 用于精细流量平衡的PV约束,以及 (ii) 用于解决一对多分配冲突和减少冗余曝光的基于合同轮盘的选择机制。
- •我们提出的框架已在美团GD广告系统中部署。大量线上A/B测试验证了其有效性和效率,与之前的线上基线相比,每用户平均收入(ARPU)提升了28.17%,交付率(Fulfillment Rate)提升了2.12%。
## 2. 相关工作
GD广告的研究在建模目标和解决策略方面都有显著演进。早期方法侧重于通过离线优化满足合约保证。SHALE (Bharadwaj 等,2012 (https://arxiv.org/html/2605.21556#bib.bib6)) 将GD广告建模为可扩展的二次规划以满足印象投放目标,而基于对偶的方法(Chen 等,2011 (https://arxiv.org/html/2605.21556#bib.bib10))进一步考虑了广告主侧效用,架起了保证履行与业务效果之间的桥梁。近线控制策略被引入以更好地对齐投放与实时平台动态。XShale (Fang 等,2019 (https://arxiv.org/html/2605.21556#bib.bib3)) 基于短期反馈调整投放节奏,优化广告主成果。RAP (Zhang 等,2020 (https://arxiv.org/html/2605.21556#bib.bib7)) 进一步纳入了流量效率和投放公平性等平台层级关注点,标志着近线环境下多目标协调的早期尝试。近期工作将GDA表述为在复杂约束下的序列决策问题。AUAF (Cheng 等,2022 (https://arxiv.org/html/2605.21556#bib.bib1)) 在最优控制框架中引入了槽位级互斥性,提高了合约投放精度。CONFLUX (Wang 等,2022 (https://arxiv.org/html/2605.21556#bib.bib9)) 和 FACC (Dai 等,2023 (https://arxiv.org/html/2605.21556#bib.bib8)) 使用多阶段控制机制联合优化投放、广告主效用和平台级目标。
尽管这些方法有效,但缺乏细粒度的页面浏览级流量控制和对多槽位协同的显式建模,限制了它们防止过度曝光和确保跨不同广告位公平投放的能力。
参见说明 图 1. 提出框架概览。该图提供了所提方法的视觉总结。
## 3. 方法
我们将多槽位广告分配问题建模为广告请求与合约之间的离线二分图匹配任务,其中每次页面浏览包含多个槽位。我们提出的框架如图1 (https://arxiv.org/html/2605.21556#S2.F1) 所示,包含两个关键组件:(1) **页面浏览约束分配模块**,该模块计算全局协调的分配概率,同时施加新颖的页面浏览约束以限制每个槽位的曝光量并平衡跨位置的流量;以及 (2) **基于合同轮盘的选择模块**,该模块通过概率性地为每个请求选择一个获胜合约来解决一对多匹配冲突。
### 3.1. 页面浏览约束分配模块
为了协调同一页面浏览内多个槽位的广告投放,我们将分配任务表述为一个约束优化问题。该公式不仅捕捉合约交付和用户参与度,还实现了对槽位级曝光的精细控制。特别地,我们引入了一种新颖的页面浏览约束来限制每个槽位可服务的曝光次数,从而防止高流量位置的过度曝光,促进所有广告位之间更平衡的流量分配。详细的目标函数和约束定义如下,包含三部分。第一项是平滑正则项,惩罚实际分配 \(x_{ij}\) 与标准化目标投放比率 \(\theta_j\) 之间的偏差,这有助于稳定合约交付并提高分配公平性。第二项是优先级感知奖励项,鼓励系统为更高优先级的合约分配更多曝光。第三项是兴趣感知匹配项,促进具有更高估计用户兴趣相关性的分配。
\(1\)
\[
\arg\min_{x_{ij}} \quad \frac{1}{2}\sum_j\sum_{i\in\Gamma(j)} s_i \frac{V_j}{\theta_j} (x_{ij}-\theta_j)^2 - \sum_j w_j \sum_{i\in\Gamma(j)} s_i x_{ij} - \sum_j \lambda_j \sum_{i\in\Gamma(j)} s_i x_{ij} c_{ij}
\]
\(2\)
\[
\text{s.t.} \quad \sum_{i\in\Gamma(j)} s_i x_{ij} \leq d_j, \quad \forall j
\]
\(3\)
\[
\sum_{j\in\Gamma(i)} x_{ij} \leq 1, \quad \forall i
\]
\(4\)
\[
x_{ij} \geq 0, \quad \forall i,j
\]
\(5\)
\[
s_i x_{ij} \leq pv_i, \quad \forall i,j
\]
其中 \(x_{ij}\) 表示从请求 \(i\)(即供给)到合约 \(j\)(即需求)的分配概率,\(c_{ij}\) 表示两者之间的用户兴趣;\(s_i\) 表示请求 \(i\) 的容量,\(d_j\) 表示合约 \(j\) 所需的曝光次数;\(\lambda_j\) 反映用户兴趣对需求 \(j\) 的重要性。与以往工作不同,我们引入 \(pv_i\) 来表示请求 \(i\) 的页面浏览约束,从而能够显式控制槽位级曝光和平衡流量分配,这是我们公式的一个关键创新点。令 \(\Gamma(j)\) 表示可以服务合约 \(j\) 的请求集合,\(\Gamma(i)\) 表示请求 \(i\) 有资格服务的合约集合。
拉格朗日函数:
\[
L(\alpha,\beta,\gamma,\delta)= \frac{1}{2}\sum_j\sum_{i\in\Gamma(j)} s_i \frac{V_j}{\theta_j} (x_{ij}-\theta_j)^2 - \sum_j w_j \sum_{i\in\Gamma(j)} s_i x_{ij} - \sum_j \lambda_j \sum_{i\in\Gamma(j)} s_i x_{ij} c_{ij} + \sum_j \alpha_j \left(\sum_{i\in\Gamma(j)} s_i x_{ij} - d_j\right) + \sum_i \beta_i \left(\sum_{j\in\Gamma(i)} x_{ij} - 1\right) - \sum_j \sum_{i\in\Gamma(j)} \gamma_{ij} x_{ij} + \sum_j \sum_{i\in\Gamma(j)} \delta_{ij} \left(s_i x_{ij} - pv_i\right)
\]
KKT 条件:
\(7\)
\[
s_i \frac{V_j}{\theta_j} (x_{ij}-\theta_j) - w_j s_i - \lambda_j s_i c_{ij} + \alpha_j s_i + \beta_i s_i - \gamma_{ij} + \delta_{ij} s_i = 0
\]
\(8\)
\[
\alpha_j \left(\sum_{i\in\Gamma(j)} s_i x_{ij} - d_j\right) = 0
\]
\(9\)
\[
\beta_i \left(\sum_{j\in\Gamma(i)} x_{ij} - 1\right) = 0
\]
\(10\)
\[
\gamma_{ij} x_{ij} = 0
\]
\(11\)
\[
\delta_{ij} \left(s_i x_{ij} - pv_i\right) = 0
\]
\(12\)
\[
\alpha_j \geq 0, \quad \beta_i \geq 0, \quad \gamma_{ij} \geq 0, \quad \delta_{ij} \geq 0
\]
其中 \(\alpha_j\)、\(\beta_i\)、\(\gamma_{ij}\) 和 \(\delta_{ij}\) 分别是约束条件式 (8)、式 (9)、式 (10) 和式 (11) 的拉格朗日乘子。根据 KKT 条件,最优分配概率 \(x_{ij}\) 可推导为:
\(13\)
\[
x_{ij} = \max\left\{0, \ \theta_j \left(1 + \frac{w_j + \lambda_j c_{ij} - \alpha_j - \beta_i - \delta_{ij}}{V_j}\right)\right\}
\]
为了高效求解带PV约束的分配问题,我们采用在线分布式策略,基于KKT条件更新对偶变量 \(\alpha_j\)、\(\beta_i\) 和 \(\delta_{ij}\)。这些对偶变量分别对应合约需求、请求容量和槽位级页面浏览约束。我们并不直接求解在大规模场景下计算代价高昂的原问题,而是利用从KKT最优性条件推导出的 \(x_{ij}\) 闭式表达式,并使用投影梯度步骤迭代调整对偶变量。
在每次迭代中,如果分配给合约 \(j\) 的总曝光量超过其需求 \(d_j\),则增大 \(\alpha_j\);同时更新 \(\beta_i\) 以确保请求 \(i\) 的总分配保持在其容量范围内。类似地,调整 \(\delta_{ij}\) 以强制执行每个广告位的精细页面浏览约束。每个合约 \(j\) 由优先级权重 \(w_j\)、平滑参数 \(V_j\) 和标准化目标投放比率 \(\theta_j = \frac{d_j}{\sum_{i\in\Gamma(j)} s_i}\) 来表征,其中 \(V_j\) 控制第 \(j\) 个合约公平性正则化的强度。使用目标函数相对于 \(x_{ij}\) 的梯度来指导迭代更新。这些操作在所有 \((i,j)\) 对上并行执行,确保了可扩展性和实时适应性。整体过程总结在算法1 (https://arxiv.org/html/2605.21556#S3.1) 中。相似文章
基于模型压缩与并行验证的高效大语言模型广告生成
本文提出了一种利用模型压缩和并行验证的高效大语言模型广告框架,在百度的实际部署中实现了超过 1.8 倍的加速。
统一建模与探索的生成式自动竞价
本文介绍了Guide框架,该框架结合了决策Transformer、Q值引导和逆动力学模块,在数字广告自动出价中平衡探索与安全性,并在公开数据集和模拟拍卖中展示了有效性。
学会匹配:具有时间扩展反馈的双边匹配
本文介绍了一个具有时间扩展反馈的双边匹配框架,将其建模为部分可观测的马尔可夫博弈,包含昂贵筛选、噪声观测和动态变化的潜在特征。作者提出了多智能体强化学习基准Learn2Match,并展示了独立PPO在社会福利方面优于bandit基线,但信息摩擦损失更高。
UniScale: 通过模型路由与测试时扩展的在线联合优化实现自适应统一推理扩展
提出UniScale,一种在线框架,通过上下文多臂老虎机优化统一模型路由和测试时扩展,以在LLM推理中实现更好的质量-成本权衡。
DeltaRubric:通过联合规划与验证实现生成式多模态奖励建模
DeltaRubric 是一篇研究论文,介绍了一种使用单一多模态大语言模型(MLLM)的两步多模态偏好评估方法,通过联合规划与验证来提高奖励建模的可靠性。