question-generation

#question-generation

构建程序性推理评估数据集：平衡自然性、基础性和多跳覆盖

arXiv cs.AI ↗ · 昨天缓存

本文探讨了基于TMK的问题生成策略如何影响AI学习系统中程序性和多跳推理的数据集质量，比较了严格TMK生成、先转录后生成和TMK感知生成三种策略，并引入了一个基础性验证框架。

0 人收藏 0 人点赞

#question-generation

arXiv cs.CL ↗ · 昨天缓存

本文介绍了HieraRAG，这是一种用于确定RAG基准最优粒度的层次化框架。它生成了跨三个维度的5,872个合成问答对，并发现理想粒度因维度而异，为从业者提供了一种可移植的程序。

0 人收藏 0 人点赞

#question-generation

arXiv cs.AI ↗ · 2026-06-02 缓存

本文介绍了FETCH分类器，它使用大型语言模型集成来为自动化法律受理生成跟进问题，评估问题质量和成本权衡。研究发现，需要GPT-5等高成本模型才能提出有效的平实语言问题，并提出了评估此类问题的评分标准。

0 人收藏 0 人点赞

#question-generation

arXiv cs.CL ↗ · 2026-05-27 缓存

本文介绍了 slidesqaqa，这是一个基于 Flask 的软件系统，能从 PDF 幻灯片中生成富有教学价值的问题。该系统采用四阶段大语言模型流水线，依次进行文本和图像提取、全幻灯片范围内的问题规划、幻灯片标注以及输出整合，在技术讲座幻灯片上展示了高保真的问题生成能力。

0 人收藏 0 人点赞