automated-scoring

#automated-scoring

基于LLM的自动化评分中可学习的评估技能：通过迭代优化构建评分标准

arXiv cs.CL ↗ · 2026-05-29 缓存

本文提出为LLM学习评估技能，以自动化评分任务的评分标准构建，达到与专家编写的评分标准相当的性能，且无需人工编写的示例。

0 人收藏 0 人点赞

#automated-scoring

量化评分标准修改对人类与自动评分者一致性影响的统计分析

arXiv cs.CL ↗ · 2026-05-08 缓存

本研究分析了评分标准（rubrics）的修改（例如从整体性标准转变为分析性标准）如何影响人类评分者与 AI 自动评分者之间的一致性。研究结果表明，提供示例和减少偏见有助于提高一致性，而更高的复杂性往往会降低一致性。

0 人收藏 0 人点赞

#automated-scoring

# 基于文本与音频分类器的学生异常言语响应检测来源：[https://arxiv.org/html/2604.16717](https://arxiv.org/html/2604.16717) \(论文将于2026年4月10日在国家教育测量委员会会议上发表\) ###### 摘要本文旨在填补自动言语响应评分（AVRS）使用中的一项关键安全空白。我们提出了一种新颖的混合框架，用于识别存在心理困扰的学生，该框架结合了文本分类器与音频分类器；其中文本分类器经过训练以根据内容检测响

0 人收藏 0 人点赞

automated-scoring

基于LLM的自动化评分中可学习的评估技能：通过迭代优化构建评分标准

量化评分标准修改对人类与自动评分者一致性影响的统计分析

基于文本与音频分类器的学生异常言语响应检测

提交意见反馈