思维的谱几何：相变、指令反转、Token级动力学与Transformers推理中的完美正确性预测

arXiv cs.LG 2026/04/20 04:00 论文

摘要

对11个大型语言模型的全面谱分析，揭示了Transformers在推理与事实回忆过程中隐层激活空间中的相变现象，发现了七个基本现象，包括谱压缩、指令微调反转以及仅基于谱特性的完美正确性预测（AUC=1.0）。

arXiv:2604.15350v1 公告类型：新论文摘要：我们发现大型语言模型在进行推理与事实回忆时，其隐层激活空间中表现出**谱相变**现象。通过对跨越**11个模型**和**5个架构族**（Qwen、Pythia、Phi、Llama、DeepSeek-R1）的系统谱分析，我们确定了**七个**核心现象：(1) **推理谱压缩** -- 9/11模型在推理任务中表现出明显较低的α值（p < 0.05），强模型中效应更大；(2) **指令微调谱反转** -- 基础模型表现为推理α < 事实α，而指令微调模型则反转这一关系；(3) **架构依赖生成分类法** -- prompt到response的转变分为扩展、压缩和平衡三个体系；(4) **谱缩放律** -- 在4个Qwen基础模型中α_reasoning ∝ -0.074 ln N（R² = 0.46）；(5) **Token级谱级联** -- 逐Token的alpha追踪揭示了随层距呈指数衰减的局部同步，且在推理任务中弱于事实任务；(6) **推理步骤谱标点** -- 相变特征与推理步骤边界对齐；(7) **谱正确性预测** -- 仅基于谱α在预测最终答案生成**前**的正确性时，可达到AUC = 1.000（Qwen2.5-7B，后期层），在6个模型中的平均AUC = 0.893。这些发现共同建立了Transformers中推理的综合**谱理论**，揭示思维的几何在方向上具有通用性，在动力学上具有架构特异性，且对结果具有预测性。

查看原文

查看缓存全文

缓存时间: 2026/04/20 08:33

# 思想的谱几何：相变、指令反转、令牌级动态和变换器推理中的完美正确性预测

来源：https://arxiv.org/html/2604.15350

###### 摘要

我们发现大语言模型在进行推理与事实回忆时，在隐藏激活空间中表现出*谱相变*。通过对跨越5个架构族（Qwen、Pythia、Phi、Llama、DeepSeek-R1）的11个模型进行系统谱分析，我们识别了七个基本现象：(1)推理谱压缩——9/11个模型在推理时显示显著较低的α (p<0.05)，效应大小与模型能力相关；(2)指令微调谱反转——基础模型显示推理α < 因子α，在所有模型和层中R²>0.85（见附录B.4）。提示-响应分解。我们分别分析Hprompt(ℓ)∈RTp×d和Hresponse(ℓ)∈RTr×d，使我们能够追踪从输入处理到生成的谱转变。提示-响应delta ΔαP→R = αresponse - αprompt量化了生成过程中谱结构如何变化。令牌级动态。为了进行精细时间分析，我们在每个生成步骤以w=10令牌的滑动窗口计算α，产生跨层和时间的每令牌谱轨迹α(t,ℓ)。该窗口在捕捉局部谱结构的同时保持足够的奇异值以进行可靠估计。梯度分析∇tα(t,ℓ) = α(t+1,ℓ) - α(t,ℓ)揭示推理步骤边界处的谱转变事件。

### 3.2 统计分析

对于每个比较（推理对事实、提示对响应），我们在显著性水平αstat = 0.05处使用Welch双样本t检验。对于谱缩放律，我们通过普通最小二乘法拟合Δα = a ln N + b并报告R²。对于正确性预测，我们用5折分层交叉验证训练逻辑回归分类器并报告AUC（ROC曲线下面积）。AUC > 0.5的统计显著性通过排列检验（1000次排列）评估。

### 3.3 模型

我们分析了11个模型，跨越5个架构族和4个训练范式（表1）。这相对于初步分析（v1：6个模型，3个族）扩展了3.7倍，配对的基础-指令模型（Qwen 3B、Phi族）实现了对指令微调效果的受控分析。

表1：模型清单：11个模型跨越5个架构族和4个训练范式。

### 3.4 任务设计

我们的基准包含21个任务，组织成三个类别（完整任务列表见附录A）：

推理任务（13个任务）：多步算术（3个任务：2步、3步、4步链）、代数应用题（2个任务：线性方程、比例问题）、逻辑推演（3个任务：三段论、消除谜题、约束满足）、算法追踪（3个任务：循环执行、递归展开、数据结构操作）和组合推理（2个任务：嵌套条件、多跳推理）。

事实回忆任务（6个任务）：单事实检索，跨越地理（首都、国家事实）、科学（元素性质、物理常数）、历史（日期、事件）和常识。

随机基线任务（2个任务）：包含随机令牌序列的提示，建立非结构化输入的谱基线。

所有实验使用贪心解码（温度=0）以确保可重复性。相位分析的最大生成长度为200令牌，令牌级动态为500令牌。

### 3.5 分布外验证任务

为测试谱正确性预测器（发现7）的泛化能力，我们设计了40个问题，跨越4个训练期间未见的新类别：

- **代码追踪**（10个问题）：Python代码执行预测，包括列表操作、字典操作、递归和列表推导。
- **常识推理**（10个问题）：日常算术和时间推理（日历计算、食谱缩放、速度-距离-时间）。
- **多跳数学**（10个问题）：多步应用题，需要3+个推理步骤和中间变量追踪。
- **逻辑消除**（10个问题）：过程消除谜题（宠物分配、比赛排序、错误标记的箱子、三段论推理）。

每个类别包括5个直接回答和5个思维链变体，以评估提示格式敏感性。

## 4 结果

### 4.1 发现1：通用推理谱压缩

参见图1：跨模型谱差异。所有11个模型中推理-事实的Δα。负值表示推理谱压缩（更低的α，更分布式的表示）。9/11个模型显示显著压缩（p<0.05）；两个例外是Qwen指令模型显示反转（发现2）。误差条表示跨任务的标准误。

表2：推理对事实谱α跨11个模型。Δα = 推理-事实（负值=推理更分布式）。仅响应的ΔαR控制提示效果。

| 模型 | 类型 | αR | αF | Δα | ΔαR | p |
|-----|------|-----|-----|--------|---------|-----------|
| Qwen 2.5-0.5B | Base | 1.159 | 1.481 | -0.219 | +0.287 | <10⁻⁹ |
| Qwen 2.5-3B | Base | 0.985 | 1.398 | -0.318 | +0.301 | <10⁻⁵ |
| Qwen 2.5-7B | Base | 0.832 | 1.512 | -0.464 | +0.221 | <10⁻⁵ |
| Qwen 2.5-1.5B-I | Instruct | 0.946 | 1.685 | +0.206 | +0.307 | <10⁻²⁸ |
| Qwen 2.5-3B-I | Instruct | 0.949 | 1.409 | +0.121 | +0.291 | <10⁻¹⁰ |
| DeepSeek-R1-1.5B | Reasoning | 1.415 | 1.402 | -0.291 | -0.318 | <10⁻⁸ |
| Pythia-1B | Base | 1.836 | 1.347 | -0.096 | -0.118 | 0.121 |
| Pythia-2.8B | Base | 1.584 | 1.217 | -0.130 | -0.163 | 0.001 |
| Phi-2 | Base | 1.036 | 1.216 | -0.106 | -0.124 | <10⁻⁷ |
| Phi-3.5-I | Instruct | 0.937 | 1.536 | +0.009 | +0.019 | 0.739 |
| TinyLlama-Chat | Chat | 1.478 | 1.132 | -0.119 | -0.059 | 0.004 |

表2和图1呈现了我们的核心发现：11个模型中的9个在推理和事实任务谱配置文件之间显示统计显著差异。在检查完整激活谱（Δα）时，大多数显示推理谱压缩（推理时α较低）。两个例外——Qwen指令模型——显示*相反*的模式，这直接导出我们的第二个发现。

仅响应分析（ΔαR）将生成阶段与提示效果隔离。有趣的是，在仅响应比较中，Qwen基础模型显示*正的*ΔαR，意味着其推理响应实际上有*更高的* alpha比事实响应。这与总体Δα的表观矛盾产生于大的负的提示-响应转移（发现3）以不同方式影响两个任务类型。

效应大小。|Δα|的幅度跨模型变化很大：从0.009（Phi-3.5-I，不显著）到0.464（Qwen2.5-7B，p<10⁻⁶⁵）。在Qwen基础族内，效应大小随模型容量增长：0.219→0.318→0.464（对应0.5B→3B→7B），连接到发现4（谱缩放律）。

### 4.2 发现2：指令微调谱反转

参见图2：指令微调谱反转。(A) Qwen2.5-3B基础对指令的每层α配置文件：基础将推理（实线）分离在事实（虚线）下方，而指令显示重叠/反转。(B) 响应阶段的每层Δα：基础（蓝色）持续为正而指令（红色）在早期层中持续为负。(C) 显示反转模式的模型对之间的总结。

我们最引人注目的发现是**指令微调反转了推理的谱特征**。比较配对的基础-指令模型：

- **Qwen2.5-3B Base**：Δα = -0.318（推理=更分布式）
- **Qwen2.5-3B Instruct**：Δα = +0.121（推理=更集中）
- **反转幅度**：0.439

类似地，Phi族显示相同模式：

- **Phi-2（Base）**：Δα = -0.106
- **Phi-3.5-mini（Instruct）**：Δα = +0.009（几乎反转为零）

解释。基础模型在*广泛分布的*表示中编码推理（许多谱维度）。指令微调教会模型使用*聚焦、高效的*表示执行推理——将相关信息浓缩到更少的谱方向。这与指令微调作为"学习高效推理"而非"学习推理"是一致的。

DeepSeek-R1作为平衡。推理蒸馏模型显示Δα = -0.291（如基础模型），但具有接近零的提示-响应转移（发现3）。这表明推理蒸馏保留了类似基础模型的谱分离同时实现生成稳定性。

### 4.3 发现3：三类别生成转移分类法

参见图3：生成转移分类法。跨11个模型的提示-响应α转移。模型划分为三个体制：扩展（负转移，蓝色）、平衡（接近零）和压缩（正转移，红色）。该划分与规范化架构的对齐度高于模型族。

凭借11个模型，我们将生成转移分析细化为清晰的三类别分类法（图3）：

1. **谱扩展**（Δα < -0.1，7个模型）：Qwen基础（0.5B：-0.32、3B：-0.41、7B：-0.68）、Qwen指令（1.5B-I：-0.74、3B-I：-0.46）、Phi-3.5-I（-0.60）、Phi-2（-0.18）。激活在生成期间变得谱更宽。

2. **谱平衡**（|Δα| < 0.1，1个模型）：DeepSeek-R1（+0.01）。接近零的转移表明模型维持一致的谱结构。

3. **谱压缩**（Δα > 0.1，3个模型）：Pythia-1B（+0.49）、Pythia-2.8B（+0.37）、TinyLlama-Chat（+0.35）。激活在生成期间变得谱更集中。

关键洞察。该划分主要由**规范化架构**控制：具有RMSNorm + SwiGLU的模型（Qwen、Phi-3.5、DeepSeek-R1）显示扩展或平衡，而具有标准LayerNorm的模型（Pythia、TinyLlama）显示压缩。这将*动态*生成行为连接到权重矩阵分析中发现的*静态*规范化边界效应Liu（2026）。

### 4.4 发现4：谱缩放律

参见图4：谱缩放律。模型大小N（参数）与推理-事实谱delta Δα之间的对数线性关系，跨4个Qwen基础模型。拟合线Δα = -0.074 ln N - 0.317（R² = 0.46）显示较大模型在推理和事实表示之间实现更大谱分离。

扩展到4个Qwen基础模型（图4），谱缩放律变为：

ΔαR-F = -0.074 ln N - 0.317（R² = 0.46）(3)

虽然R²从0.99（3点拟合）降至0.46（4点拟合），*方向*保持一致：更大的模型显示更大的|Δα|（推理和事实表示之间更多分离）。降低的R²揭示关系并非完全对数线性——0.5B模型显示的分离比预期少，暗示一个阈值效应，其中非常小的模型无法充分利用分布式推理表示。

关键是，缩放仅在族内适用。跨族，架构差异主导大小效应：1B Pythia有|Δα| = 0.10，而0.5B Qwen有|Δα| = 0.22。

### 4.5 发现5：令牌级谱级联

参见图5：令牌级谱动态。(A) 在5个目标层（0、9、18、27、35）处的每令牌α，在多步数学生成期间（Qwen2.5-3B-Instruct）。实线：原始；虚线：平滑。(B) 生成期间的层间方差，显示与推理步骤转变相关的波动。

通过在每个生成令牌处追踪谱α，我们发现**谱级联**：信息通过网络以指数衰减同步配置文件传播。

跨层梯度相关。我们计算不同层处的每令牌α梯度之间的皮尔逊相关：

表3：平均跨层梯度相关（5个任务，Qwen2.5-3B-Instruct）。相邻层高度同步；远离层几乎独立。

相关衰减遵循（参见附录D的扩展分析）：

ρ(d) ≈ 0.998 · e^(-d/19.8) (4)

特征长度τ = 19.8层（r = -0.72，p = 0.019）。这意味着谱动态在~20层内本地同步但在该范围之外全局独立。

推理解耦远距层。表3中的Δρ列揭示推理任务系统地*减少*远距层对的跨层同步（L0–L35的Δρ = -0.19，L9–L35的-0.22）。推理似乎需要跨远距层的*更独立的*谱处理，与在不同深度处需要多样计算模式一致。

### 4.6 发现6：推理步骤谱标点

参见图6：令牌级谱动态和推理步骤谱标点。生成期间跨多层的每令牌谱α轨迹，显示推理如何诱导特征谱动态。α中的梯度尖峰与推理步骤边界一致（例如，"Step 1:"、"therefore"、段落中断），而事实任务显示集中的初始检索，后跟稳定生成。

令牌级alpha梯度分析（图6）揭示**相变特征与推理步骤边界重合**：

- **数学推理**（GSM风格）：Alpha梯度尖峰出现在标记步骤转变的令牌处（"\n\n"、"Step 2:"、计算结果如"= 13"）。在第9层，top梯度变化与"step"、"determine"、"Per"和段落中断对齐。

- **逻辑推理**：梯度尖峰在"houses"、"means"、"contrad[icts]"——模型整合约束的时刻。

- **事实任务**：梯度尖峰集中在响应*开始*（初始事实检索），而非分布于整个生成过程。

思维的谱几何：相变、指令反转、Token级动力学与Transformers推理中的完美正确性预测

相似文章

我发现Transformer中一个预测几何稳定性的隐藏比率 [R]

Transformer 记忆的吸引子几何：从冲突仲裁到自信幻觉

@machinestein: ICML 2026：TRMs中的潜在推理实际上是策略改进算子为什么递归推理，尤其是…

LLMs为何在结构化知识上产生幻觉：对线性化表示推理的机制分析

@GoukiMinegishi: 我们的论文被接收为 #ICML2026 Spotlight! LLM中的推理通过链式局部步骤得到了很大改进。但这是……

提交意见反馈