ECI_{sem}: 语义残差有效对比信息用于评估难负样本
摘要
ECI_sem是一种无需训练的方法,通过使用冻结的嵌入对密集检索中的难负样本源进行排序,在MS MARCO和BEIR基准上取得了强性能。
查看缓存全文
缓存时间: 2026/06/08 23:18
论文页面 - ECI_{sem}:用于评估难负样本的语义残差有效对比信息
来源:https://huggingface.co/papers/2603.20990
发布日期:6月5日
·
由 https://huggingface.co/chungimungi 提交
Aarush (https://huggingface.co/chungimungi) 于6月8日
摘要
ECI_{sem} 是有效对比信息的一种语义残差变体,它利用冻结的嵌入向量对密集检索的负样本源进行排序,无需训练,在 MS MARCO 和 BEIR 基准测试上取得了强劲性能。
密集检索中的难负样本源选择通常只有在微调和下游评估之后才能确定。我们提出 ECI_{sem}——有效对比信息 (ECI) 的语义残差变体,该变体使用冻结的目标编码器嵌入向量来对候选负样本源进行排序。ECI_{sem} 无需训练,但需要标签:每个得分的样本需包含一个查询、一个已标注的正样本以及一个显式的候选负样本。ECI_{sem} 从目标一致性、语义局部性、词汇残差性和一个对数行列式多样性目标出发,构建了一个加权残差信息矩阵。在 MS MARCO 负样本源上,同族 ECI_{sem} 在非混合源中将 LLM 负样本排为最高,在混合源中将 Dense+LLM 排为最高,这与 DistilBERT、E5-base 和 Contriever 上最强的聚合 BEIR 迁移结果相匹配。受控消融实验表明,这种一致性依赖于使用目标编码器族,而额外的消融实验则显示其在样本量、温度、分词器和 IDF 语料扰动下具有稳定性。理论给出了与损失降低的局部线性化联系,而实证研究则将下游评估作为最终测试。
查看 arXiv 页面 (https://arxiv.org/abs/2603.20990)
查看 PDF (https://arxiv.org/pdf/2603.20990)
加入收藏 (https://huggingface.co/login?next=%2Fpapers%2F2603.20990)
在您的代理中获取此论文:
hf papers read 2603.20990
没有最新的 CLI?curl -LsSf https://hf.co/cli/install.sh | bash
引用此论文的模型 0
没有模型链接此论文
请在模型 README.md 中引用 arxiv.org/abs/2603.20990,以从此页面链接。
引用此论文的数据集 0
没有数据集链接此论文
请在数据集 README.md 中引用 arxiv.org/abs/2603.20990,以从此页面链接。
引用此论文的 Spaces 0
没有 Space 链接此论文
请在 Space README.md 中引用 arxiv.org/abs/2603.20990,以从此页面链接。
包含此论文的合集 0
没有合集包含此论文
请将此论文添加到合集 (https://huggingface.co/new-collection) 中,以从此页面链接。
相似文章
HNC:利用困难负样本描述提升模型的细粒度视觉-语言理解能力
本文介绍了困难负样本描述(HNC),这是一种数据集和方法,旨在通过解决网络采集的图文对中存在的弱关联问题,训练视觉-语言模型以实现细粒度理解。
Sem-Detect: 面向语义级别的AI生成同行评审检测方法
Sem-Detect 提出了一种结合文本特征与声明级语义分析的方法,用于区分AI生成的同行评审与人类撰写的评审。在0.1%假阳性率下,其真阳性率相比基线提升了25.5%,并且表明经过大语言模型润色的人类评审仍保留独特的语义信号,仅有不到3.5%被误判为AI生成。
Concrete Jungle:利用词汇具体性铺路,革新对比负样本挖掘以提升组合理解
提出 Slipform 训练框架,借助词汇具体性筛选更困难的负样本,并引入基于边界的 Cement 损失,显著提升视觉-语言模型的组合推理能力。
当Softmax在顶部失败时:InfoNCE的极值校正
该论文指出了基于softmax的InfoNCE损失与现代对比学习中的归一化嵌入设置之间的不一致性。它提出了WEINCE,一种简单的修改,利用极值理论将softmax logits与端点短缺校正相结合,在视觉基准测试中取得了持续的改进。
证据缺失并非证据不足:事实核查中NEI构建伪影的诊断
本文介绍了NEI-CAP,一种用于评估事实核查基准中“信息不足”示例构建方式的诊断协议,揭示了在易于取巧的NEI构建上训练的模型无法迁移到更难的、语义相关的信息不足案例上。