rubric-scoring

#rubric-scoring

从评分到解释：评估基于量规的教学质量评估中的SHAP与LLM理由

arXiv cs.CL ↗ · 2026-06-05 缓存

本文提出一个用于基于量规评分的句子级可解释性框架，比较了SHAP和LLM生成的理由。研究发现，微调预训练语言模型在预测准确性上优于LLM，且SHAP提供了更忠实和可迁移的解释。

0 人收藏 0 人点赞