rubric-scoring

标签

Cards List
#rubric-scoring

从评分到解释:评估基于量规的教学质量评估中的SHAP与LLM理由

arXiv cs.CL · 2026-06-05 缓存

本文提出一个用于基于量规评分的句子级可解释性框架,比较了SHAP和LLM生成的理由。研究发现,微调预训练语言模型在预测准确性上优于LLM,且SHAP提供了更忠实和可迁移的解释。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈