标签
本文提出一种人在回路流水线,用于测量计算机科学项目对课程指南的覆盖情况,并纵向应用于CS2013和CS2023。该框架显示主题覆盖率近乎恒定,但由于新版指南提高了期望,认知深度存在差距。
本文通过布鲁姆分类学评估了六个LLM,以判断其生成能激发高阶思维的教育问题的能力,并引入了一种提示策略,该策略使重复率降低了24.45%,高阶输出增加了11.53%。