best-of-n

#best-of-n

最佳-$N$ TTS评估受到ASR族对齐的混淆

arXiv cs.CL ↗ · 2026-07-10 缓存

本文识别了最佳N选择TTS评估中的一个混淆因素：ASR验证器的表面质量强烈依赖于用作评估器的ASR族。作者提出了跨族排名集成方法，在多个评估器上实现了更低的词错误率。

0 人收藏 0 人点赞

#best-of-n

Hugging Face Daily Papers ↗ · 2026-07-05 缓存

Flash-BoN 通过时间步截断、层跳过和激活代理生成廉价的草稿候选，然后使用多阶段验证选择最佳草稿进行完整细化，从而在固定挂钟预算下优于基线，提高文本到图像生成的效率。

0 人收藏 0 人点赞

#best-of-n

arXiv cs.CL ↗ · 2026-06-03 缓存

本文提出了一种方法，利用单次带标签验证集采样中获得的廉价统计量，预测语言模型的最佳N选一推理扩展增益。一个仅有三个核心特征的紧凑预测器与真实增益的斯皮尔曼相关系数ρ=0.90，使得在昂贵的奖励模型评分之前能够筛选配置。

0 人收藏 0 人点赞

#best-of-n

arXiv cs.CL ↗ · 2026-05-18 缓存

BetaPRM 是一种过程奖励模型，它使用来自蒙特卡洛延续的 Beta 信念来预测步骤级的成功概率以及该预测的可靠性，从而实现自适应计算分配，在提高准确性的同时将 token 使用量减少高达 33.57%。

0 人收藏 0 人点赞