实例表示学习中的损失函数 [R]

Reddit r/MachineLearning 2026/06/29 23:34 论文

摘要

讨论实例表示学习中的损失函数，重点介绍使用 NCE 来近似计算不可行的 MLE 目标。

在 Wu 等人中，由于数据集中图像数量庞大，MLE 目标在计算上不可行。非参数 Softmax 负对数似然当 n 很大时，(2) 中的分母难以计算。因此，他们使用了 NCE（噪声对比估计）。NCE 目标本质上，他们用更容易计算的 (7) 中的损失来近似 (3) 中难以计算的损失。然而，我们最终还是在 (8) 中估计了分母。为什么不直接用 (8) 来近似 (2) 中的分母呢？我问了 Claude 这个问题，它说这会产生有偏估计，但我并不太理解。我也有点困惑，原始 NCE 公式是作为估计密度的方法，而这里的使用方式之间有何联系；我们这样做是因为 NCE 损失更容易计算，并且随着 m（噪声样本数量）的增加，NCE 损失的梯度和 NLL 损失的梯度会趋于一致吗？

查看原文

实例表示学习中的损失函数 [R]

相似文章

损失不足：对比表示学习中的采样条件与归纳偏置

当Softmax在顶部失败时：InfoNCE的极值校正

PromptNCE: 仅使用大语言模型和对比估计提示的点互信息预测

# 监督学习中的贝叶斯充分表示

加权对比学习的统一几何框架

提交意见反馈