debiasing

#debiasing

SamaVaani：印度语言多语言临床ASR的审计与去偏

arXiv cs.CL ↗ · 10小时前缓存

本文对印度语言的精神病学访谈中的多语言临床ASR系统进行了系统性审计，并提出了SamaVaani，一种统一的去偏技术，旨在提升跨人口群体的性能与公平性。

0 人收藏 0 人点赞

#debiasing

尾巴中的捷径：通过微调更新的后验谱压缩进行去偏

arXiv cs.LG ↗ · 2026-06-09 缓存

一种后验方法通过截断权重更新矩阵SVD的尾部来减少微调大语言模型中的虚假相关性。该方法在不重新训练或使用群体标签的情况下，将虚假群体差距最多减少5倍，精度损失小于2个百分点。

0 人收藏 0 人点赞

#debiasing

PEARL：基于对比学习的无偏分位数估计在工业级直播推荐中的应用

arXiv cs.LG ↗ · 2026-05-22 缓存

PEARL引入了一种对比分位数近似框架，用以缓解推荐系统中的行为强度不平衡问题，在服务数十亿用户的生产级直播平台上实现了参与度指标的显著提升。

0 人收藏 0 人点赞

#debiasing

DebiasRAG：一种通过检索增强生成实现大语言模型公平生成的无调优路径

arXiv cs.CL ↗ · 2026-05-18 缓存

DebiasRAG 提出了一种无调优、查询特定的去偏框架，利用检索增强生成来减少大语言模型中的社会偏见，同时不降低其原有能力。

0 人收藏 0 人点赞

#debiasing

解决“打地鼠困境”：一种更智能的 AI 视觉模型去偏方法

MIT News — Artificial Intelligence ↗ · 2026-04-29 缓存

来自麻省理工学院（MIT）、伍斯特理工学院（WPI）和 Google 的研究人员提出了 WRING，这是一种用于视觉语言模型（VLM）的新型后处理去偏方法，旨在避免在消除特定偏见时放大其他偏见的“打地鼠困境”。

0 人收藏 0 人点赞

#debiasing

# 专家乘积训练减少自然语言推理中的数据集伪影来源：[https://arxiv.org/html/2604.19069](https://arxiv.org/html/2604.19069) ###### 摘要神经NLI模型过度拟合数据集伪影而非真正推理。仅假设模型在SNLI上达到57.7%，显示出强烈虚假关联，其中38.6%的基线错误源于这些伪影。作者提出专家乘积（PoE）训练，对偏见模型过度自信的样本降权。

0 人收藏 0 人点赞

debiasing

SamaVaani：印度语言多语言临床ASR的审计与去偏

尾巴中的捷径：通过微调更新的后验谱压缩进行去偏

PEARL：基于对比学习的无偏分位数估计在工业级直播推荐中的应用

DebiasRAG：一种通过检索增强生成实现大语言模型公平生成的无调优路径

解决“打地鼠困境”：一种更智能的 AI 视觉模型去偏方法

专家乘积训练减少自然语言推理中的数据集伪影

提交意见反馈