ReasoningLens：大型推理模型的层次化可视化与诊断审计

Hugging Face Daily Papers 2026/06/22 00:00 论文

reasoning-models visualization auditing open-source chain-of-thought diagnostic-tools

摘要

ReasoningLens 是一个开源框架，为大型推理模型中的复杂推理链提供层次化可视化与诊断审计，支持结构化分析和错误检测。

大型推理模型的出现引入了异常长的思维链痕迹，造成了透明度负担，关键逻辑常常被大量程序性文本所掩盖。为解决这一问题，我们推出了 ReasoningLens，这是一个开源框架，旨在对复杂推理链进行层次化可视化和诊断审计。ReasoningLens 通过以下方式解决信息剖析问题：(1) 将痕迹构建成交互式层次结构，将高层策略与底层执行分开；(2) 利用智能审计器进行自动化错误检测和工具增强验证；(3) 综合系统性推理画像，揭示模型特有的盲点。通过将无结构的文本墙转化为可操作洞见，ReasoningLens 为解读、调试和优化下一代以推理为中心的AI提供了模块化基础。

查看原文

查看缓存全文

缓存时间: 2026/06/30 03:33

论文页面 - ReasoningLens：大型推理模型的分层可视化与诊断审核

来源：https://huggingface.co/papers/2606.23404

摘要

ReasoningLens 是一个开源框架，为大型推理模型中的复杂推理链提供分层可视化和诊断审核功能，通过交互式层次结构和自动化审核实现结构化分析与错误检测。

大型推理模型的出现带来了异常长的思维链轨迹（https://huggingface.co/papers?q=Chain-of-Thought%20traces），造成了透明度负担，关键逻辑常常被淹没在大篇幅的程序性文本中。为解决这一问题，我们提出了 ReasoningLens，这是一个专为复杂推理链的分层可视化（https://huggingface.co/papers?q=hierarchical%20visualization）与诊断审核（https://huggingface.co/papers?q=diagnostic%20auditing）设计的开源框架。ReasoningLens 通过以下方式应对信息尸检（https://huggingface.co/papers?q=information%20necropsy）：(1) 将轨迹结构化为交互式层次，使高层策略与底层执行分离；(2) 利用智能体审核器（https://huggingface.co/papers?q=agentic%20auditor）进行自动错误检测和工具增强验证（https://huggingface.co/papers?q=tool-augmented%20verification）；(3) 合成系统性推理画像（https://huggingface.co/papers?q=systemic%20reasoning%20profiles）以揭示模型特有的盲点。通过将非结构化的文本墙转化为可操作的洞察，ReasoningLens 为解释、调试和优化下一代以推理为中心的 AI 提供了模块化基础。

查看 arXiv 页面（https://arxiv.org/abs/2606.23404）查看 PDF（https://arxiv.org/pdf/2606.23404）GitHub（https://github.com/icip-cas/ReasoningLens）添加到收藏（https://huggingface.co/login?next=%2Fpapers%2F2606.23404）

引用本文的模型0

没有模型链接此论文

在模型 README.md 中引用 arxiv.org/abs/2606.23404 即可从此页面链接。

引用本文的数据集0

没有数据集链接此论文

在数据集 README.md 中引用 arxiv.org/abs/2606.23404 即可从此页面链接。

引用本文的 Spaces0

没有 Space 链接此论文

在 Space README.md 中引用 arxiv.org/abs/2606.23404 即可从此页面链接。

包含本文的收藏集0

没有收藏集包含此论文

将此论文添加到收藏集（https://huggingface.co/new-collection）即可从此页面链接。

ReasoningLens：大型推理模型的层次化可视化与诊断审计

论文页面 - ReasoningLens：大型推理模型的分层可视化与诊断审核

摘要

引用本文的模型0

引用本文的数据集0

引用本文的 Spaces0

包含本文的收藏集0

相似文章

大型学习模型中增强且高效的推理

解码大型推理模型中的批判机制

ReasoningFlow: 用于理解LLM推理轨迹的篇章结构

指令层级失效之处：诊断与修复推理语言模型中的故障

大型语言模型中的推理源于受限推理流形

提交意见反馈