标签
本文介绍了DRIVE,一个统一的基于Transformer的离线自动出价框架,它将候选动作生成与决策制定解耦,结合了分布性动作建模、检索增强的候选生成和基于价值的评估,以在预算和成本约束下提高出价性能。
本文提出检索增强的语言校准(RALC),一种事后流水线方法,通过将语言置信度建模为分布并使用检索增强重写来校准大语言模型中的置信度信号。它引入了忠实度散度指标,并在多个基准测试中展示了显著改进。