explanation-faithfulness

#explanation-faithfulness

从评分到解释：评估基于量规的教学质量评估中的SHAP与LLM理由

arXiv cs.CL ↗ · 2026-06-05 缓存

本文提出一个用于基于量规评分的句子级可解释性框架，比较了SHAP和LLM生成的理由。研究发现，微调预训练语言模型在预测准确性上优于LLM，且SHAP提供了更忠实和可迁移的解释。

0 人收藏 0 人点赞

#explanation-faithfulness

arXiv cs.CL ↗ · 2026-05-26 缓存

本文提出了一个因果框架，用于量化LLM评审中的合理化偏见，即判决和解释受非证据性线索而非底层文本的影响。该框架提出了线索干预、锚定度量以及Proof-Before-Preference缓解协议，展示了改进的线索不变性。

0 人收藏 0 人点赞