标签
本文探讨了基于TMK的问题生成策略如何影响AI学习系统中程序性和多跳推理的数据集质量,比较了严格TMK生成、先转录后生成和TMK感知生成三种策略,并引入了一个基础性验证框架。
本文介绍了HieraRAG,这是一种用于确定RAG基准最优粒度的层次化框架。它生成了跨三个维度的5,872个合成问答对,并发现理想粒度因维度而异,为从业者提供了一种可移植的程序。
本文介绍了FETCH分类器,它使用大型语言模型集成来为自动化法律受理生成跟进问题,评估问题质量和成本权衡。研究发现,需要GPT-5等高成本模型才能提出有效的平实语言问题,并提出了评估此类问题的评分标准。
本文介绍了 slidesqaqa,这是一个基于 Flask 的软件系统,能从 PDF 幻灯片中生成富有教学价值的问题。该系统采用四阶段大语言模型流水线,依次进行文本和图像提取、全幻灯片范围内的问题规划、幻灯片标注以及输出整合,在技术讲座幻灯片上展示了高保真的问题生成能力。