gender-bias

标签

Cards List
#gender-bias

将LLM性别偏见锚定于人类基线:一项跨语言审计

arXiv cs.CL · 2026-06-01 缓存

本文对六种大型语言模型在英语、韩语、中文和日语中的性别刻板印象进行审计,并以人类基线作为锚定。研究发现,LLM的刻板印象程度往往超过人类跨国差异,且可能跨语言叠加,为此引入了一个四模式框架来表征此类行为。

0 人收藏 0 人点赞
#gender-bias

针对语言模型中性别化与性别中立生成的神经元级干预

arXiv cs.CL · 2026-06-01 缓存

本文提出了一种神经元级干预方法,识别语言模型中的性别特定神经元(女性、男性、性别中立),并在保留语义的同时引导句子生成朝向目标性别形式,实验表明该方法可实现精确控制并缓解偏见。

0 人收藏 0 人点赞
#gender-bias

你的多模态语音模型说我长了一张适合广播的脸

arXiv cs.CL · 2026-06-01 缓存

本文首次对多模态语音识别模型进行了偏见评估,发现在将人脸与音频配对时,跨性别和种族的准确率存在显著差异,这对AI系统的公平性具有重要意义。

0 人收藏 0 人点赞
#gender-bias

EquiSumm:一种基于性别偏见感知的包容性推文摘要生成框架

arXiv cs.CL · 2026-05-25 缓存

提出EquiSumm,一种基于性别偏见感知的包容性推文摘要生成框架,确保不同性别群体意见的代表性,解决自动摘要中的群体公平性问题。

0 人收藏 0 人点赞
#gender-bias

偏见与推理机制:解读链式思维提示对大型语言模型中性别偏见的影响

arXiv cs.CL · 2026-05-21 缓存

本文研究了链式思维提示对大型语言模型中性别偏见的影响,发现它并不能持续减少偏见,而且表面上的改进源于浅层服从而非真正的理解。

0 人收藏 0 人点赞
#gender-bias

AI为男女生成了相同的简历:女性的更可能被贴上“能力不足”的标签,而男性的则获得了97%的认可率

Reddit r/ArtificialInteligence · 2026-05-11 缓存

一项研究发现,为男女生成的相同AI简历获得了显著不同的评价,女性的简历更易因其能力和可信度受到质疑。这反映出人们对AI使用认知中存在的广泛性别偏见,并可能进一步加剧AI应用的差距。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈