预测性辅助与探索性压缩的时间动态
摘要
本文开发了一个几何动力学框架,用于模拟预测性AI辅助如何通过稳定自我生成探索之前的轨迹来改变探索性认知,从而导致探索响应性降低、滞后现象以及辅助撤回后的延迟恢复。
arXiv:2606.10094v1 公告类型:新论文
摘要:经典认知理论将问题解决描述为对结构化问题空间的探索性搜索,其中反复交互逐渐将搜索压缩为高效的表征结构。预测性人工智能系统引入了一种不同的机制,即在探索性多样化展开之前就可能发生稳定化,在内部生成搜索之前就提供解决方案和决策轨迹。本文开发了一个几何动力学框架,其中注意力在由稳定漂移、内源性探索扰动和响应性门控学习塑造的策略景观上演化。预测性辅助被建模为一种外源性探索压缩过程,在自我生成探索拓宽策略空间的可达区域之前稳定轨迹。该框架得出三个主要结果。第一,持续的预测性稳定化通过减弱固有扰动的有效影响来降低探索响应性,即使探索变异性仍然存在。第二,曲率不对称地累积和松弛,产生滞后现象以及辅助撤回后探索移动性的延迟恢复。第三,发展结果关键取决于稳定化的时机,早期干预在广泛表征多样化发生之前限制了未来的探索遍历。该框架产生了关于预测稳定化后探索熵、过早收敛和延迟恢复的可实证检验的预测。更广泛地说,结果表明预测系统可能重塑探索性认知本身的几何结构。
查看缓存全文
缓存时间: 2026/06/10 06:13
# 预测性辅助与探索性压缩的时间动力学 来源:https://arxiv.org/html/2606.10094 Balaraju Battu1,2 1European University Institute, Florence, Italy 2New York University Abu Dhabi, UAE ###### 摘要 经典认知理论将问题解决描述为通过结构化问题空间进行的探索性搜索,在此过程中,重复的交互逐步将搜索压缩为高效的表示结构。预测性人工智能系统引入了一种不同的机制,在这种机制中,稳定化可能在探索性多样化展开之前发生,从而在内部生成的搜索之前提供解决方案和决策轨迹。本文发展了一个几何动力学框架,其中注意力在一个由稳定化漂移、内源探索性扰动和响应门控学习共同塑造的策略景观上演化。预测性辅助被建模为一种外源探索性压缩过程,它在自我生成的探索拓宽策略空间的可达区域之前稳定化轨迹。该框架产生了三个主要结果。首先,持续的预测性稳定化通过减弱内在扰动的有效影响来降低探索性响应性,即使探索性变异性仍然存在。其次,曲率不对称地积累和松弛,产生滞后现象以及辅助退出后探索性移动性的延迟恢复。第三,发展结果关键取决于稳定化的时机,早期干预在广泛的表示多样化发生之前就会缩小未来的探索性遍历。该框架产生了关于探索性熵、过早收敛以及预测性稳定化后延迟恢复的经验可检验预测。更广泛地说,结果表明预测性系统可能重塑探索性认知本身的几何结构。 ## 1 引言 经典认知科学将问题解决描述为通过结构化问题空间进行的探索性搜索,而非穷尽式优化[31 (https://arxiv.org/html/2606.10094#bib.bib3),35 (https://arxiv.org/html/2606.10094#bib.bib1),16 (https://arxiv.org/html/2606.10094#bib.bib46)]。专业知识通过反复的探索性参与而出现,这种参与逐渐将搜索压缩为高效的表示结构和稳定的解决方案例程[10 (https://arxiv.org/html/2606.10094#bib.bib2),31 (https://arxiv.org/html/2606.10094#bib.bib3),30 (https://arxiv.org/html/2606.10094#bib.bib4)]。在这一经典图景中,压缩发生在探索性多样化之后。预测性人工智能系统引入了一种不同的机制。这类系统越来越多地在不确定性被充分体验之前进行干预,在内部生成的搜索之前提供解决方案、补全和候选轨迹[2 (https://arxiv.org/html/2606.10094#bib.bib5),9 (https://arxiv.org/html/2606.10094#bib.bib14),29 (https://arxiv.org/html/2606.10094#bib.bib9),32 (https://arxiv.org/html/2606.10094#bib.bib24),24 (https://arxiv.org/html/2606.10094#bib.bib47)]。这些系统提高了短期性能,但其对探索性认知的长期影响仍然知之甚少。因此,当前工作的核心关注点并非认知替代,而是改变的压缩动力学。预测性系统可能在探索性多样化展开之前稳定化轨迹,从而缩小采样替代方案的范围,并逐步压缩跨认知景观的探索性移动性。现有的人工智能安全和社会影响框架主要关注错误信息、公平性、鲁棒性以及任务层面的过度自动化依赖[4 (https://arxiv.org/html/2606.10094#bib.bib10),6 (https://arxiv.org/html/2606.10094#bib.bib12)]。最近,新兴研究开始考察代理型人工智能系统如何侵蚀学习激励,并导致集体知识形成的长期退化[1 (https://arxiv.org/html/2606.10094#bib.bib11)]。在GPS导航、自动化、认知卸载和人工智能辅助专业知识方面的平行发现同样表明,预测性系统可能随着时间的推移改变探索性参与、认知映射和技能习得[13 (https://arxiv.org/html/2606.10094#bib.bib6),29 (https://arxiv.org/html/2606.10094#bib.bib9),28 (https://arxiv.org/html/2606.10094#bib.bib7)]。然而,这些担忧在很大程度上仍然分散在认知科学、人机交互和自动化研究领域,缺乏一个统一的动力学描述来解释预测性稳定化如何在发展时间尺度上重塑探索性搜索。 大量文献表明,困难、延迟和部分失败在学习中发挥着建设性作用[5 (https://arxiv.org/html/2606.10094#bib.bib25),25 (https://arxiv.org/html/2606.10094#bib.bib26)]。与不确定性的探索性参与支持表示修正、假设生成和策略发现[18 (https://arxiv.org/html/2606.10094#bib.bib15),21 (https://arxiv.org/html/2606.10094#bib.bib16)]。这种探索往往由内源波动维持,包括好奇心、自发思维和预测误差[36 (https://arxiv.org/html/2606.10094#bib.bib17),11 (https://arxiv.org/html/2606.10094#bib.bib20),15 (https://arxiv.org/html/2606.10094#bib.bib27),12 (https://arxiv.org/html/2606.10094#bib.bib28)]。重要的是,当前框架并不意味着所有形式的预测性辅助都必然抑制探索。预测性系统也可能通过鼓励发散推理或延迟收敛来保留或放大探索性分支。因此,关键区别不在于辅助与非辅助之间,而在于过早压缩探索性搜索的稳定化干预与保留跨替代表示广泛遍历的探索性干预之间。 为了分析这一过程,我们发展了一个几何动力学框架,其中注意力在稳定化漂移和内源探索性扰动的共同影响下,在一个策略景观上演化[37 (https://arxiv.org/html/2606.10094#bib.bib40),26 (https://arxiv.org/html/2606.10094#bib.bib35)]。该景观的几何形状支配着探索性响应性和跨表示轨迹的适应性移动性。浅层区域允许跨竞争表示的广泛遍历,而陡峭区域则将注意力集中在局部强化的配置附近[23 (https://arxiv.org/html/2606.10094#bib.bib32),3 (https://arxiv.org/html/2606.10094#bib.bib33),33 (https://arxiv.org/html/2606.10094#bib.bib34)]。预测性辅助作为一种曲率修改过程进入,它在探索性多样化充分扩展策略空间的可达区域之前稳定化轨迹。因此,压缩是外源地发生的,而不是通过探索性遍历本身逐渐出现。 核心含义在于,适应性僵化不仅取决于生物可塑性,还取决于嵌入在探索性搜索几何结构中的累积稳定化历史[19 (https://arxiv.org/html/2606.10094#bib.bib21),22 (https://arxiv.org/html/2606.10094#bib.bib23),27 (https://arxiv.org/html/2606.10094#bib.bib41)]。早期的预测性稳定化可以在广泛的表示库形成之前缩小未来的探索性移动性[7 (https://arxiv.org/html/2606.10094#bib.bib29),25 (https://arxiv.org/html/2606.10094#bib.bib26),17 (https://arxiv.org/html/2606.10094#bib.bib42)]。由于稳定化不对称地积累和松弛,其影响可能在辅助退出后持续存在,导致探索性行为中的滞后、亚稳态陷阱和路径依赖[8 (https://arxiv.org/html/2606.10094#bib.bib45),14 (https://arxiv.org/html/2606.10094#bib.bib44)]。 下文发展的框架通过一个最小动力学模型形式化了这些过程,该模型将探索性注意力、响应性和曲率动力学联系起来。该模型产生了结构性后果,包括滞后、过早收敛、非线性逃逸动力学以及预测性稳定化下对时机敏感的僵化。它还产生了关于探索性熵、延迟恢复和探索性移动性长期压缩的经验可检验预测。 ## 2 几何视角 我们将深思熟虑形式化为在结构化策略景观上的运动,其中注意力在稳定化漂移和内源探索性变化的共同影响下演化,这与基于动力系统和吸引子的认知描述一致[37 (https://arxiv.org/html/2606.10094#bib.bib40),33 (https://arxiv.org/html/2606.10094#bib.bib34)]。该景观编码了跨认知配置的相对努力、稳定性和遍历难度。浅层区域允许广泛的探索性遍历,而陡峭区域则将注意力集中在狭窄且局部强化的轨迹上。在这个框架中,探索性搜索对应于跨不同曲率区域的运动,而稳定化的专业知识对应于将轨迹集中到高效的吸引子盆地中。 探索被视为适应性认知的一个构成特征,而非外部干扰。由不确定性、好奇心、联想漂移和预测误差产生的内源波动持续地将注意力从局部稳定状态移开,从而实现跨替代表示配置的转换。可塑性决定了这些扰动能否有效地重定向轨迹并重塑内部表示。随着盆地的加深,探索性变异性可能仍然存在,但其在策略空间竞争区域中产生成功遍历的能力逐渐下降。 预测性辅助引入了一种独特的外源稳定化形式。通过在探索性多样化展开之前提供外部稳定的轨迹,预测性系统可能在广泛的表示采样之前压缩所探索的替代方案空间。在当前框架内,预测性辅助因此充当一种曲率修改过程,重塑了探索性搜索本身的几何结构。下文发展的模型通过将探索性注意力、响应性和曲率积累耦合起来的动力学形式化了这种相互作用。 ## 3 委托认知的几何模型 深思熟虑被建模为在策略景观上的运动,其中注意力在稳定化漂移和内源探索性扰动的共同影响下演化。令\(x(t)\)表示当前的注意力状态,令\(U(x,t)\)表示一个有效势能,编码策略空间附近区域的局部认知稳定性、表示连贯性和遍历成本。在没有预测性辅助的情况下,注意力根据噪声梯度流演化: \[ \dot{x}(t) = -\nabla U(x,t) + \sqrt{R(\kappa(x,t))}\,\zeta(t), \] 其中\(\zeta(t)\)是一个归一化随机过程,表示内源探索性扰动。梯度项捕捉了认知倾向于落入局部强化且认知高效配置的趋势,而随机项则捕捉了由不确定性、自发思维、联想漂移和表示竞争产生的探索性变化。因此,深思熟虑的轨迹产生于局部稳定化与跨景观的持久探索性位移之间的相互作用。 因子\(\sqrt{R(\kappa)}\)使得探索性运动依赖于探索性响应性。当响应性高时,扰动可以重定向轨迹,注意力遍历策略空间的多个邻近区域。当响应性低时,相同的扰动失去有效杠杆作用,注意力被限制在景观中越来越狭窄的区域。探索性变异性可能仍然存在,但其在竞争表示轨迹中产生成功遍历的能力逐渐下降。从几何角度看,曲率增加压缩了探索性搜索,并降低了跨景观的适应性移动性。 这一表述将探索性扰动视为结构上持久但几何上可调的。因此,该模型孤立了稳定化结构如何约束探索的有效性,而不假设好奇心或自发思维完全消失。在实践中,持续的低努力互动也可能减少探索性变化本身的产生,引入了预测性辅助抑制探索的次要路径。本框架抽象掉了这一额外机制,以便孤立稳定化和累积结构压缩的几何效应。 为了将探索性注意力与学习联系起来,我们引入一个内部假设变量\(z(t)\),表示学习者不断演进的世界工作模型。令\(S(x,t)\)表示当关注占据区域\(x\)时遇到的信号。假设修正的演化如下: \[ \dot{z}(t) = R(\kappa(x,t))\big(S(x,t)-z(t)\big). \] 当响应性高时,期望与传入信号之间的差异迅速重塑内部表示,并允许跨竞争概念轨迹的修正。当响应性低时,即使失配仍然显著,更新也会减慢。因此,学习不仅取决于证据的可用性,还取决于景观的几何结构是否保留了足够的探索性移动性,以便进行修正和表示重组。 响应性本身由曲率控制。令\(\kappa(x,t)\)表示策略景观的局部曲率。我们将响应性建模为一个递减函数: \[ R(\kappa) = \frac{1}{1+\gamma\kappa}, \quad \gamma>0, \] 因此浅盆地支持广泛的探索性搜索、灵活的遍历和快速更新,而陡盆地则抑制这三个过程。这一表述形式化了以下想法:重复的稳定化逐步将认知搜索压缩到越来越狭窄且局部强化的轨迹中。随着深思熟虑反复收敛于稳定化的表示,对扰动的响应性下降,未来跨越策略空间中不熟悉区域的遍历变得越来越受限。 这一视角引入了内源压缩与外源压缩之间的区别。在经典的专业知识形成中,压缩通过自我生成的探索性参与和重复的表示重组逐渐出现。预测性辅助引入了压缩可能在广泛的表示采样之前外源地发生的可能性。通过在不确定性驱动的搜索之前提供稳定的轨迹,预测性系统可能在灵活的内部结构形成之前缩小所探索的替代方案空间。因此,系统可能在熟悉的轨迹内变得越来越高效,同时逐渐失去跨越不熟悉概念区域的探索性移动性。在当前框架内,预测性辅助因此充当一种曲率修改过程,重塑了认知探索本身的几何结构。 ### 3.1 辅助作为几何变形 在当前框架内,预测性辅助作为一种外源压缩形式,重塑了认知搜索本身的几何结构。在经典的专业知识中,压缩通过自我生成的探索性参与和重复的表示重组逐渐出现。预测性辅助引入了压缩可能在广泛的表示采样之前外源地发生的可能性。通过在不确定性驱动的搜索之前提供稳定的轨迹,预测性系统可能在灵活的内部结构形成之前缩小所探索的替代方案空间。因此,系统可能在熟悉的轨迹内变得越来越高效,同时逐渐失去跨越不熟悉概念区域的探索性移动性。在当前框架内,预测性辅助因此充当一种曲率修改过程,重塑了认知探索本身的几何结构。相似文章
AI辅助优化下的探索性响应与适应刚性
本文开发了一个动态框架,分析AI辅助优化如何根据系统初始的适应响应能力,减少或增强探索性适应,从而导致可能的亚稳态陷阱或探索崩溃动态。
TRACE:面向长周期智能体安全的轨迹风险感知压缩方法
本文提出 TRACE,一种面向长周期 LLM 智能体的轨迹级安全检测方法,通过将完整轨迹证据压缩为潜在状态,更好地聚合分散的风险信号,在多个基准上达到最先进的准确率。
用于离策略时序差分预测的行为感知辅助修正
本文提出用于离策略时序差分预测的行为感知辅助修正,引入了BA-TDC和BA-TDRC算法,这些算法用行为贝尔曼矩阵替代辅助协方差矩阵,以提高稳定性和收敛性。理论分析和在标准基准上的实验验证了所提方法的有效性。
分解提示如何引导行为
本文介绍了一个嵌套的几何分解框架,用于分析提示如何重新组织大型语言模型和视觉-语言模型的内部表征。作者表明,仿射变换,特别是跨维度的线性混合,是解释提示引起的行为变化的关键。
有效的解释支持不确定性下的规划
本研究论文提出了一种计算模型,通过模拟过程性解释在不确定性下如何指导行动规划来评估其有效性。通过四项实验,作者表明,被该模型赋予更高分数的解释被认为更有用,并能带来更好的导航表现。