llm-fairness

#llm-fairness

Explanation Fairness in Large Language Models: An Empirical Analysis of Disparities in How LLMs Justify Decisions Across Demographic Groups

arXiv cs.CL ↗ · 2026-05-12 Cached

This paper introduces the Explanation Fairness Taxonomy (EFT) to analyze disparities in how LLMs justify decisions across demographic groups, finding significant biases in explanation quality and tone despite balanced decisions.

0 favorites 0 likes

#llm-fairness

Investigating Counterfactual Unfairness in LLMs towards Identities through Humor

arXiv cs.CL ↗ · 2026-04-22 Cached

Academic study exposes systemic counterfactual unfairness in LLMs: jokes from privileged speakers are refused 67% more often and rated as more malicious than identical jokes from marginalized speakers.

0 favorites 0 likes

llm-fairness

Explanation Fairness in Large Language Models: An Empirical Analysis of Disparities in How LLMs Justify Decisions Across Demographic Groups

Investigating Counterfactual Unfairness in LLMs towards Identities through Humor

Submit Feedback