标签
本文提出了一种系统,将先验知识图谱与基于PPO的策略相结合,以结构化LLM的苏格拉底式辅导,实验表明,在学生的掌握程度和效率上,该系统优于启发式方法和前沿模型基线。
斯坦福法学院的一项研究发现,在对合同法课程简答题辅导的盲评中,法学院教授对大型语言模型生成的答案评分高于同伴答案,LLM在75.33%的比较中胜出,且较少被标记为有害。
介绍了EduAgentBench,一个基于源的基准,用于评估辅导智能体在教学专业判断、多轮辅导以及自主教学工作流程执行方面的能力。对前沿模型的评估表明,它们在情境化辅导和工作流任务中仍未能达到专业教学标准。