reading-comprehension

标签

Cards List
#reading-comprehension

LLMs难以衡量区分不同水平学生的能力:阅读理解评估中题目区分度研究

arXiv cs.CL · 5天前 缓存

本文评估了42个大语言模型在测量阅读理解评估中题目区分度的能力,发现其与人类校准指标弱相关,并指出这是心理测量评估中的一个开放挑战。

0 人收藏 0 人点赞
#reading-comprehension

一种用于阅读理解题目生成中特征约束难度控制的多智能体框架

arXiv cs.CL · 2026-05-20 缓存

本文提出MAFIG,一种多智能体框架,利用LLM智能体和特征特定的评估器,通过遵循指定的特征约束来生成难度可控的阅读理解题目。实验表明,与基线方法相比,MAFIG在约束满足率和稳健的难度控制方面表现出显著优势。

0 人收藏 0 人点赞
#reading-comprehension

基于微调Transformer的无响应项目难度建模用于多项选择题:组件表示与多任务学习

arXiv cs.CL · 2026-05-19 缓存

本文提出对Transformer编码器进行端到端微调,用于多项选择阅读理解项目的无响应项目难度建模,包括组件变体和多任务变体,表明多任务学习在小样本情况下有所改进。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈