reasoning-language-models

#reasoning-language-models

CheckRLM：检索增强推理中的有效知识-思维一致性检查

arXiv cs.CL ↗ · 2026-07-03 缓存

CheckRLM是一个利用检索增强生成来检测并纠正推理语言模型推理链中事实错误的框架，提升了连贯性并减少了错误累积。

0 人收藏 0 人点赞

#reasoning-language-models

arXiv cs.AI ↗ · 2026-06-09 缓存

本文引入了一个白盒诊断框架，将推理语言模型中的指令层级故障定位为识别、冲突解决和响应实现三个阶段。该框架评估了多个模型，并提出了两种无需训练的自我监控机制，可将违规率降低81%–99%。

0 人收藏 0 人点赞