思维的谱几何:相变、指令反转、Token级动力学与Transformers推理中的完美正确性预测

arXiv cs.LG 论文

摘要

对11个大型语言模型的全面谱分析,揭示了Transformers在推理与事实回忆过程中隐层激活空间中的相变现象,发现了七个基本现象,包括谱压缩、指令微调反转以及仅基于谱特性的完美正确性预测(AUC=1.0)。

arXiv:2604.15350v1 公告类型:新论文 摘要:我们发现大型语言模型在进行推理与事实回忆时,其隐层激活空间中表现出**谱相变**现象。通过对跨越**11个模型**和**5个架构族**(Qwen、Pythia、Phi、Llama、DeepSeek-R1)的系统谱分析,我们确定了**七个**核心现象:(1) **推理谱压缩** -- 9/11模型在推理任务中表现出明显较低的α值(p < 0.05),强模型中效应更大;(2) **指令微调谱反转** -- 基础模型表现为推理α < 事实α,而指令微调模型则反转这一关系;(3) **架构依赖生成分类法** -- prompt到response的转变分为扩展、压缩和平衡三个体系;(4) **谱缩放律** -- 在4个Qwen基础模型中α_reasoning ∝ -0.074 ln N(R² = 0.46);(5) **Token级谱级联** -- 逐Token的alpha追踪揭示了随层距呈指数衰减的局部同步,且在推理任务中弱于事实任务;(6) **推理步骤谱标点** -- 相变特征与推理步骤边界对齐;(7) **谱正确性预测** -- 仅基于谱α在预测最终答案生成**前**的正确性时,可达到AUC = 1.000(Qwen2.5-7B,后期层),在6个模型中的平均AUC = 0.893。这些发现共同建立了Transformers中推理的综合**谱理论**,揭示思维的几何在方向上具有通用性,在动力学上具有架构特异性,且对结果具有预测性。
查看原文
查看缓存全文

缓存时间: 2026/04/20 08:33

# 思想的谱几何:相变、指令反转、令牌级动态和变换器推理中的完美正确性预测

来源:https://arxiv.org/html/2604.15350

###### 摘要

我们发现大语言模型在进行推理与事实回忆时,在隐藏激活空间中表现出*谱相变*。通过对跨越5个架构族(Qwen、Pythia、Phi、Llama、DeepSeek-R1)的11个模型进行系统谱分析,我们识别了七个基本现象:(1)推理谱压缩——9/11个模型在推理时显示显著较低的α (p<0.05),效应大小与模型能力相关;(2)指令微调谱反转——基础模型显示推理α < 因子α,在所有模型和层中R²>0.85(见附录B.4)。提示-响应分解。我们分别分析Hprompt(ℓ)∈RTp×d和Hresponse(ℓ)∈RTr×d,使我们能够追踪从输入处理到生成的谱转变。提示-响应delta ΔαP→R = αresponse - αprompt量化了生成过程中谱结构如何变化。令牌级动态。为了进行精细时间分析,我们在每个生成步骤以w=10令牌的滑动窗口计算α,产生跨层和时间的每令牌谱轨迹α(t,ℓ)。该窗口在捕捉局部谱结构的同时保持足够的奇异值以进行可靠估计。梯度分析∇tα(t,ℓ) = α(t+1,ℓ) - α(t,ℓ)揭示推理步骤边界处的谱转变事件。

### 3.2 统计分析

对于每个比较(推理对事实、提示对响应),我们在显著性水平αstat = 0.05处使用Welch双样本t检验。对于谱缩放律,我们通过普通最小二乘法拟合Δα = a ln N + b并报告R²。对于正确性预测,我们用5折分层交叉验证训练逻辑回归分类器并报告AUC(ROC曲线下面积)。AUC > 0.5的统计显著性通过排列检验(1000次排列)评估。

### 3.3 模型

我们分析了11个模型,跨越5个架构族和4个训练范式(表1)。这相对于初步分析(v1:6个模型,3个族)扩展了3.7倍,配对的基础-指令模型(Qwen 3B、Phi族)实现了对指令微调效果的受控分析。

表1:模型清单:11个模型跨越5个架构族和4个训练范式。

### 3.4 任务设计

我们的基准包含21个任务,组织成三个类别(完整任务列表见附录A):

推理任务(13个任务):多步算术(3个任务:2步、3步、4步链)、代数应用题(2个任务:线性方程、比例问题)、逻辑推演(3个任务:三段论、消除谜题、约束满足)、算法追踪(3个任务:循环执行、递归展开、数据结构操作)和组合推理(2个任务:嵌套条件、多跳推理)。

事实回忆任务(6个任务):单事实检索,跨越地理(首都、国家事实)、科学(元素性质、物理常数)、历史(日期、事件)和常识。

随机基线任务(2个任务):包含随机令牌序列的提示,建立非结构化输入的谱基线。

所有实验使用贪心解码(温度=0)以确保可重复性。相位分析的最大生成长度为200令牌,令牌级动态为500令牌。

### 3.5 分布外验证任务

为测试谱正确性预测器(发现7)的泛化能力,我们设计了40个问题,跨越4个训练期间未见的新类别:

- **代码追踪**(10个问题):Python代码执行预测,包括列表操作、字典操作、递归和列表推导。
- **常识推理**(10个问题):日常算术和时间推理(日历计算、食谱缩放、速度-距离-时间)。
- **多跳数学**(10个问题):多步应用题,需要3+个推理步骤和中间变量追踪。
- **逻辑消除**(10个问题):过程消除谜题(宠物分配、比赛排序、错误标记的箱子、三段论推理)。

每个类别包括5个直接回答和5个思维链变体,以评估提示格式敏感性。

## 4 结果

### 4.1 发现1:通用推理谱压缩

参见图1:跨模型谱差异。所有11个模型中推理-事实的Δα。负值表示推理谱压缩(更低的α,更分布式的表示)。9/11个模型显示显著压缩(p<0.05);两个例外是Qwen指令模型显示反转(发现2)。误差条表示跨任务的标准误。

表2:推理对事实谱α跨11个模型。Δα = 推理-事实(负值=推理更分布式)。仅响应的ΔαR控制提示效果。

| 模型 | 类型 | αR | αF | Δα | ΔαR | p |
|-----|------|-----|-----|--------|---------|-----------|
| Qwen 2.5-0.5B | Base | 1.159 | 1.481 | -0.219 | +0.287 | <10⁻⁹ |
| Qwen 2.5-3B | Base | 0.985 | 1.398 | -0.318 | +0.301 | <10⁻⁵ |
| Qwen 2.5-7B | Base | 0.832 | 1.512 | -0.464 | +0.221 | <10⁻⁵ |
| Qwen 2.5-1.5B-I | Instruct | 0.946 | 1.685 | +0.206 | +0.307 | <10⁻²⁸ |
| Qwen 2.5-3B-I | Instruct | 0.949 | 1.409 | +0.121 | +0.291 | <10⁻¹⁰ |
| DeepSeek-R1-1.5B | Reasoning | 1.415 | 1.402 | -0.291 | -0.318 | <10⁻⁸ |
| Pythia-1B | Base | 1.836 | 1.347 | -0.096 | -0.118 | 0.121 |
| Pythia-2.8B | Base | 1.584 | 1.217 | -0.130 | -0.163 | 0.001 |
| Phi-2 | Base | 1.036 | 1.216 | -0.106 | -0.124 | <10⁻⁷ |
| Phi-3.5-I | Instruct | 0.937 | 1.536 | +0.009 | +0.019 | 0.739 |
| TinyLlama-Chat | Chat | 1.478 | 1.132 | -0.119 | -0.059 | 0.004 |

表2和图1呈现了我们的核心发现:11个模型中的9个在推理和事实任务谱配置文件之间显示统计显著差异。在检查完整激活谱(Δα)时,大多数显示推理谱压缩(推理时α较低)。两个例外——Qwen指令模型——显示*相反*的模式,这直接导出我们的第二个发现。

仅响应分析(ΔαR)将生成阶段与提示效果隔离。有趣的是,在仅响应比较中,Qwen基础模型显示*正的*ΔαR,意味着其推理响应实际上有*更高的* alpha比事实响应。这与总体Δα的表观矛盾产生于大的负的提示-响应转移(发现3)以不同方式影响两个任务类型。

效应大小。|Δα|的幅度跨模型变化很大:从0.009(Phi-3.5-I,不显著)到0.464(Qwen2.5-7B,p<10⁻⁶⁵)。在Qwen基础族内,效应大小随模型容量增长:0.219→0.318→0.464(对应0.5B→3B→7B),连接到发现4(谱缩放律)。

### 4.2 发现2:指令微调谱反转

参见图2:指令微调谱反转。(A) Qwen2.5-3B基础对指令的每层α配置文件:基础将推理(实线)分离在事实(虚线)下方,而指令显示重叠/反转。(B) 响应阶段的每层Δα:基础(蓝色)持续为正而指令(红色)在早期层中持续为负。(C) 显示反转模式的模型对之间的总结。

我们最引人注目的发现是**指令微调反转了推理的谱特征**。比较配对的基础-指令模型:

- **Qwen2.5-3B Base**:Δα = -0.318(推理=更分布式)
- **Qwen2.5-3B Instruct**:Δα = +0.121(推理=更集中)
- **反转幅度**:0.439

类似地,Phi族显示相同模式:

- **Phi-2(Base)**:Δα = -0.106
- **Phi-3.5-mini(Instruct)**:Δα = +0.009(几乎反转为零)

解释。基础模型在*广泛分布的*表示中编码推理(许多谱维度)。指令微调教会模型使用*聚焦、高效的*表示执行推理——将相关信息浓缩到更少的谱方向。这与指令微调作为"学习高效推理"而非"学习推理"是一致的。

DeepSeek-R1作为平衡。推理蒸馏模型显示Δα = -0.291(如基础模型),但具有接近零的提示-响应转移(发现3)。这表明推理蒸馏保留了类似基础模型的谱分离同时实现生成稳定性。

### 4.3 发现3:三类别生成转移分类法

参见图3:生成转移分类法。跨11个模型的提示-响应α转移。模型划分为三个体制:扩展(负转移,蓝色)、平衡(接近零)和压缩(正转移,红色)。该划分与规范化架构的对齐度高于模型族。

凭借11个模型,我们将生成转移分析细化为清晰的三类别分类法(图3):

1. **谱扩展**(Δα < -0.1,7个模型):Qwen基础(0.5B:-0.32、3B:-0.41、7B:-0.68)、Qwen指令(1.5B-I:-0.74、3B-I:-0.46)、Phi-3.5-I(-0.60)、Phi-2(-0.18)。激活在生成期间变得谱更宽。

2. **谱平衡**(|Δα| < 0.1,1个模型):DeepSeek-R1(+0.01)。接近零的转移表明模型维持一致的谱结构。

3. **谱压缩**(Δα > 0.1,3个模型):Pythia-1B(+0.49)、Pythia-2.8B(+0.37)、TinyLlama-Chat(+0.35)。激活在生成期间变得谱更集中。

关键洞察。该划分主要由**规范化架构**控制:具有RMSNorm + SwiGLU的模型(Qwen、Phi-3.5、DeepSeek-R1)显示扩展或平衡,而具有标准LayerNorm的模型(Pythia、TinyLlama)显示压缩。这将*动态*生成行为连接到权重矩阵分析中发现的*静态*规范化边界效应Liu(2026)。

### 4.4 发现4:谱缩放律

参见图4:谱缩放律。模型大小N(参数)与推理-事实谱delta Δα之间的对数线性关系,跨4个Qwen基础模型。拟合线Δα = -0.074 ln N - 0.317(R² = 0.46)显示较大模型在推理和事实表示之间实现更大谱分离。

扩展到4个Qwen基础模型(图4),谱缩放律变为:

ΔαR-F = -0.074 ln N - 0.317(R² = 0.46)(3)

虽然R²从0.99(3点拟合)降至0.46(4点拟合),*方向*保持一致:更大的模型显示更大的|Δα|(推理和事实表示之间更多分离)。降低的R²揭示关系并非完全对数线性——0.5B模型显示的分离比预期少,暗示一个阈值效应,其中非常小的模型无法充分利用分布式推理表示。

关键是,缩放仅在族内适用。跨族,架构差异主导大小效应:1B Pythia有|Δα| = 0.10,而0.5B Qwen有|Δα| = 0.22。

### 4.5 发现5:令牌级谱级联

参见图5:令牌级谱动态。(A) 在5个目标层(0、9、18、27、35)处的每令牌α,在多步数学生成期间(Qwen2.5-3B-Instruct)。实线:原始;虚线:平滑。(B) 生成期间的层间方差,显示与推理步骤转变相关的波动。

通过在每个生成令牌处追踪谱α,我们发现**谱级联**:信息通过网络以指数衰减同步配置文件传播。

跨层梯度相关。我们计算不同层处的每令牌α梯度之间的皮尔逊相关:

表3:平均跨层梯度相关(5个任务,Qwen2.5-3B-Instruct)。相邻层高度同步;远离层几乎独立。

相关衰减遵循(参见附录D的扩展分析):

ρ(d) ≈ 0.998 · e^(-d/19.8) (4)

特征长度τ = 19.8层(r = -0.72,p = 0.019)。这意味着谱动态在~20层内本地同步但在该范围之外全局独立。

推理解耦远距层。表3中的Δρ列揭示推理任务系统地*减少*远距层对的跨层同步(L0–L35的Δρ = -0.19,L9–L35的-0.22)。推理似乎需要跨远距层的*更独立的*谱处理,与在不同深度处需要多样计算模式一致。

### 4.6 发现6:推理步骤谱标点

参见图6:令牌级谱动态和推理步骤谱标点。生成期间跨多层的每令牌谱α轨迹,显示推理如何诱导特征谱动态。α中的梯度尖峰与推理步骤边界一致(例如,"Step 1:"、"therefore"、段落中断),而事实任务显示集中的初始检索,后跟稳定生成。

令牌级alpha梯度分析(图6)揭示**相变特征与推理步骤边界重合**:

- **数学推理**(GSM风格):Alpha梯度尖峰出现在标记步骤转变的令牌处("\n\n"、"Step 2:"、计算结果如"= 13")。在第9层,top梯度变化与"step"、"determine"、"Per"和段落中断对齐。

- **逻辑推理**:梯度尖峰在"houses"、"means"、"contrad[icts]"——模型整合约束的时刻。

- **事实任务**:梯度尖峰集中在响应*开始*(初始事实检索),而非分布于整个生成过程。

相似文章

Transformer 记忆的吸引子几何:从冲突仲裁到自信幻觉

arXiv cs.AI

本文提出了一个统一的几何框架,用于理解 Transformer 的内存故障,通过隐藏状态吸引子盆地(attractor basins)区分冲突仲裁与幻觉。研究表明,随着模型规模的扩大,几何边际(geometric margin)在检测这些故障方面优于输出熵。