llm-fairness

标签

Cards List
#llm-fairness

大型语言模型中的解释公平性:关于LLM在不同人口群体中如何证明决策的实证分析

arXiv cs.CL · 2026-05-12 缓存

本文提出了“解释公平性分类法”(Explanation Fairness Taxonomy, EFT),以分析大型语言模型(LLM)在不同人口群体中证明决策时的差异,研究发现尽管决策本身保持平衡,但在解释的质量和语调上仍存在显著偏差。

0 人收藏 0 人点赞
#llm-fairness

通过幽默调查大模型对身份群体的反事实不公

arXiv cs.CL · 2026-04-22 缓存

学术研究揭示大模型存在系统性反事实不公:特权者讲的笑话被拒绝率高出67%,且被判定为更恶意,而内容完全相同的笑话若出自边缘群体则待遇相反。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈