论网格智能中液态基质的必要性

arXiv cs.LG 论文

摘要

本文证明了在不规则、非平稳观测下主权代理网格中实现最优推理的两个必要条件:自适应时间尺度和间隙依赖性。这些条件仅由液态(连续时间)网络满足。

arXiv:2606.28413v1 Announce Type: new 摘要:主权代理网格没有中心:没有共享时钟,没有共享模型,也没有协调器来收集数据或重新训练。其能力依赖于每个代理将对等体发出的投影在线折叠成单一内部状态,这些观测以不规则、无调度的时间到达,且基于一个不能重新训练权重的基质。这些约束中的任何一个单独处理都是可行的;但同时优化所有三个则不然。我们询问这样的基质必须是什么,并从自演化潜变量在不规则外生时间被观测的模型中证明两个必要条件。由于潜变量变化,其最优估计器是时变的:自适应时间尺度是必要的,每个固定增益滤波器严格次优。又由于到达是无时钟的,最优估计取决于它们之间的时间间隔,而任何忽视间隙的网络无论宽度或深度都无法恢复该间隔。第二个条件是容量无关的:规模无法替代缺失的依赖性。这两个条件在连续时间液态类中相交。LSTM满足第一个条件,固定连续时间滤波器满足第二个,而多时间尺度液态网络同时满足两者。合成实验确认了每一个:网络达到了时间尺度,并且分离被精确计算。该刻画是必要而非充分的,并且约束固定权重基质:可以重新训练的网络通过其他方式达到该类。每个代理的证明表明必要性约束了网格中的每个代理,这是网格智能的一个结构条件。
查看原文
查看缓存全文

缓存时间: 2026/06/30 05:27

# 论网格智能对液态基质的必要性 来源:https://arxiv.org/html/2606.28413 \(2026年6月\) ###### 摘要 一个由自主主体构成的网格没有中心:没有共享时钟,没有共享模型,也没有协调者来收集数据或重新训练。其能力依赖于每个主体将其同伴发出的投影在线折叠到一个单一内部状态中,而观测数据是在不规则、非预定时间到达的,且其权重基底无法重新训练。以上任何一项约束单独处理是可行的;但要同时满足所有三项约束以实现最优折叠则并非易事。我们问这样一个基底必须是什么,并从自演化潜在状态在不规则、外生时间观测的单一模型中证明了两个必要条件。由于潜在状态在变化,其最优估计器是时变的:需要一个自适应时间尺度,而任何固定增益滤波器都是严格次优的。由于到达时间无时钟,最优估计取决于到达之间的时间间隔,这在任何宽度或深度下都是间隙盲网络无法恢复的。第二个条件是*容量无关*的:规模无法替代缺失的依赖性。这两个条件在连续时间的*液态*类中相交。LSTM满足第一个条件,固定连续时间滤波器满足第二个条件,而多时间尺度液态网络两者兼具。合成实验确认了每一个:网络达到了时间尺度,并且分离度被精确计算。该表征是必要而非充分的,并且约束固定权重基底:一个可以自由重新训练的网络通过其他方式达到该类。针对每个主体证明,该必要性约束了网格中的每个主体,是网格智能的一个结构性条件。 ## 1 引言 在一个*网格*中,自主主体在没有中心的情况下进行推理和学习。每个主体保持一个私有的、演化的状态。它只*接纳*同伴*发出*的内容中它认为相关的部分,并仅发出该状态的类型化投影,从不发出状态本身。没有主体或协调者掌握整体:智能在于每个主体从同伴那里接纳并整合到自身状态中的内容。我们称之为*网格智能*,它完全依赖于这种每个主体的整合。三个约束使得这种整合变得困难,而网格同时施加了所有三个约束。观测数据以不规则的时间到达,没有任何主体可以安排。每个观测所描述的变量持续变化,因此流是*非平稳*的,任何固定的摘要都会过时。并且主体必须*在线*操作,其权重基底无法重新训练,因为一个实时网格没有训练循环、没有数据集,也没有可供优化的目标。每个约束单独是可以处理的;它们的结合才使得最优折叠变得困难。由于到达时间有间隔,它们之间的时间间隔塑造了每次更新111信息论上:在外生(状态无关)采样下,时间间隔对潜在状态的*值*\(s^\star\)是非信息性的(\(I(\Delta;s^\star)=0\) [23 (https://arxiv.org/html/2606.28413#bib.bib23)]),但它约束了先验协方差,从而约束了增益:协方差通道(Thm1 (https://arxiv.org/html/2606.28413#Thmtheorem1))显示,这是任何间隙盲估计器都无法放弃的必要信息(时间间隔在给定噪声观测的情况下使后验更尖锐,同时未说明潜在状态的位置)。如果\(I(\Delta;s^\star)>0\)则需要信息性的、状态调节的采样,我们不假设这种情况。;由于目标持续移动,基底必须既保留过去的结构,又跟随新的变化。耦含有两个层次,我们只关注其中一个。一个*内容*门决定*哪些*同伴的投影被接纳[2 (https://arxiv.org/html/2606.28413#bib.bib2)];这是另一个问题。*时间*基底决定被接纳的观测*如何*累积到主体的状态中,之前的工作没有解决它必须是什么。我们在实时网格强制的条件下研究它:权重固定一次且永不重新训练,只有状态随数据演化,即储层或液态状态机观点[6 (https://arxiv.org/html/2606.28413#bib.bib6),7 (https://arxiv.org/html/2606.28413#bib.bib7)]。这是网格的运行条件,而非建模上的便利:主体无法知道其未来的同伴,它追踪的潜在状态从未被观测到,也没有协调者收集数据或发送新权重。那么问题变得尖锐:*一个固定权重的基底必须是什么,才能最优地整合一个非平稳、不规则时间序列流?* 我们通过从一个自演化潜在状态在不规则时间被观测的模型(§4 (https://arxiv.org/html/2606.28413#S4))中得出的两个必要条件来回答。首先,因为潜在状态移动,最优估计器是时变的,因此基底需要一个*自适应*时间尺度;一个固定增益滤波器是严格次优的(Prop.1 (https://arxiv.org/html/2606.28413#Thmproposition1);Lemma1 (https://arxiv.org/html/2606.28413#Thmlemma1)给出了显式的单极点情况)。其次,因为相同的潜在状态在无时钟的时间被观测到,最优估计取决于到达之间的时间间隔,并且*没有*间隙盲网络在任何宽度或深度下匹配它(Thm1 (https://arxiv.org/html/2606.28413#Thmtheorem1))。第二个结果是*容量无关*的:增加大小无法弥补这个差距。两个性质共同定义了*液态*类[3 (https://arxiv.org/html/2606.28413#bib.bib3),4 (https://arxiv.org/html/2606.28413#bib.bib4)]:LSTM具有第一个性质,固定连续时间滤波器具有第二个性质,而多时间尺度液态网络两者兼具(Fig.1 (https://arxiv.org/html/2606.28413#S1.F1))。我们确认了自适应时间尺度必要性对固定时间尺度和朴素自适应基线的优势,并精确计算了间隙感知的分离度(§6 (https://arxiv.org/html/2606.28413#S6))。 参考图注图1:一个细胞中的两个必要性。每个基底形成相同的更新\(h_t = h_{t-1} + a(o_t - h_{t-1})\);只有增益\(a\)不同。 (a) 固定增益是一种时间尺度:严格次优(Prop.1 (https://arxiv.org/html/2606.28413#Thmproposition1))。 (b) LSTM型门\(a = \sigma(W[o_t, h_{t-1}])\)(刻意简化;完整的细胞更丰富,但同样间隙盲)适应内容,但基于*步骤*而非经过的时间索引:它通过*步骤*保持状态,从不看到间隔\(\Delta_t\),因此在任何宽度或深度都无法匹配最优(Thm.1 (https://arxiv.org/html/2606.28413#Thmtheorem1))。 (c) 液态细胞(CfC/LTC)将\(\Delta_t\)引入增益,\(a = \sigma(W[o_t, h_{t-1}] \, \Delta_t)\),既自适应又间隙感知:必要的类。容量是错误的轴:长的步级记忆并不编码经过的时间间隔。 两个必要性都是针对单个主体证明的,但网格将每个主体置于相同的条件下,因此结果约束每个主体。这些条件也无法在网格内回避:没有主体能强迫其同伴进入规律的时钟(这是时间间隔不再重要的唯一情况),并且由于没有中心来纠正间隙盲主体,这个缺陷存在于每个节点。因此每个主体都需要一个液态基底。这是网格智能的一个结构性条件,而非任何单一滤波器的性质,是通过将单主体定理推广到网格的所有主体而得到的。这个必要性是更大表征的一个层面。一个网格在两条正交轴上耦合其主体。配套论文《网格推理》[1 (https://arxiv.org/html/2606.28413#bib.bib1)]处理*空间*轴,假设潜在状态静止:探讨一个无中心群体是否能够恢复集体答案。本文处理*时间*轴,针对单个主体:随着潜在状态演化,其基底必须是什么才能使其自身状态保持最新。结合决定接收者接纳哪些观测的内容门[2 (https://arxiv.org/html/2606.28413#bib.bib2)],这三个部分命名了网格主体运行的层次:*接纳哪些*,*集体能否恢复答案*,以及*如何及时追踪它*。我们表征最后一点,将其他两点留给配套论文。该结果是*有范围的,非普适*的。它陈述了*在固定权重基底中*最优整合需要什么。一个可以自由重新训练的网络,如GRU-D或Time-LSTM,可以通过学习达到这两个性质,而一个完全可训练的学习器根本不受限制。我们也不声称液态基底*达到了*最优,只是说液态类之外的东西无法达到;它是否达到是§6 (https://arxiv.org/html/2606.28413#S6)的经验问题。成分是经典的:时变增益滤波和变化检测[17 (https://arxiv.org/html/2606.28413#bib.bib17),18 (https://arxiv.org/html/2606.28413#bib.bib18),19 (https://arxiv.org/html/2606.28413#bib.bib19),21 (https://arxiv.org/html/2606.28413#bib.bib21)],连续时间和液态网络[3 (https://arxiv.org/html/2606.28413#bib.bib3),4 (https://arxiv.org/html/2606.28413#bib.bib4),5 (https://arxiv.org/html/2606.28413#bib.bib5)],以及储层计算[6 (https://arxiv.org/html/2606.28413#bib.bib6),7 (https://arxiv.org/html/2606.28413#bib.bib7)]。新的地方在于配对:从一个模型中得出的两个必要性,第二个是容量无关的分离,其交集*定义*了固定权重在线整合的液态类,并且范围被诚实划定。 ## 2 相关工作 #### 不规则采样时间序列。解决不规则采样的标准方法是将经过的时间间隔馈入离散递归:GRU-D通过经过的间隔衰减隐藏状态[8 (https://arxiv.org/html/2606.28413#bib.bib8)],Time-LSTM在其上设置门控[9 (https://arxiv.org/html/2606.28413#bib.bib9)],而ODE-RNN / latent-ODE模型在观测之间通过学习的ODE演化状态[10 (https://arxiv.org/html/2606.28413#bib.bib10)]。这些*达到*了间隙感知,根据Thm1 (https://arxiv.org/html/2606.28413#Thmtheorem1)它们必须如此才能最优,但它们是*训练*权重以适应间隙。我们的分离涉及一个*固定权重*基底在没有这种训练的情况下能做什么,其中连续时间细胞是原生实现(Cor.1 (https://arxiv.org/html/2606.28413#Thmcorollary1))。 #### 固定权重与训练基底。固定权重的假设也将我们的设置与分布式学习区分开来,后者联合优化共享模型:联邦平均交换权重[14 (https://arxiv.org/html/2606.28413#bib.bib14)],去中心化SGD与邻居平均模型[15 (https://arxiv.org/html/2606.28413#bib.bib15)],以及多智能体RL集中训练[16 (https://arxiv.org/html/2606.28413#bib.bib16)]。这里的基底在运行期间是冻结的(§3 (https://arxiv.org/html/2606.28413#S3)):无论是线上还是线下,没有权重被优化,因此没有东西可以共享。 #### 连续时间、液态和自适应时间尺度网络。基底是一种闭式连续时间网络[3 (https://arxiv.org/html/2606.28413#bib.bib3)],是液态时间常数ODE[4 (https://arxiv.org/html/2606.28413#bib.bib4)]的闭式近似,属于神经ODE家族[5 (https://arxiv.org/html/2606.28413#bib.bib5)]。与固定速率的递归不同,其时间常数是输入相关的且多时间尺度,这正是§4 (https://arxiv.org/html/2606.28413#S4)所依赖的:整合一个自演化的潜在状态*需要*一个自适应时间尺度,这是估计理论中时变增益滤波器优于固定增益滤波器的原因[17 (https://arxiv.org/html/2606.28413#bib.bib17),18 (https://arxiv.org/html/2606.28413#bib.bib18)],并且必须检测变化才能跟随它[19 (https://arxiv.org/html/2606.28413#bib.bib19)]。我们不声称特定的闭式网络是*唯一*这样的基底;任何自适应连续时间网络都满足该必要性。我们新增的是将液态(输入相关、多时间尺度)性质置于承重位置,而先前的处理将其视为附带现象。从储层计算、液态状态机[6 (https://arxiv.org/html/2606.28413#bib.bib6)]和回声状态网络[7 (https://arxiv.org/html/2606.28413#bib.bib7)]的谱系中,我们仅借用固定基底的思想(一个固定的连续时间递归在其动态中承载计算),而非其离线训练的读出层;我们也保持\(\rho\)固定,因此唯一的适应是在线状态,而非权重(Remark1 (https://arxiv.org/html/2606.28413#Thmremark1))。 #### 深度状态空间模型。结构化状态空间模型、HiPPO[11 (https://arxiv.org/html/2606.28413#bib.bib11)]、S4[12 (https://arxiv.org/html/2606.28413#bib.bib12)]以及选择性扫描的Mamba[13 (https://arxiv.org/html/2606.28413#bib.bib13)],是从连续时间模型推导出的递归,并使用步长\(\Delta\)离散化,而这个步长正是我们的表征发挥作用的地方。同一个\(\Delta\)可以扮演两个不同的角色:当它是输入相关时,它产生一个*自适应时间尺度*(L1),但只有当它*是*时间间隔时才产生*经过间隔依赖*(L2)。Mamba的选择使得\(\Delta\)成为*内容*的函数,而不是经过时间的函数(\(\Delta = \text{softplus}(\text{Linear}(x))\));其标量化简([13 (https://arxiv.org/html/2606.28413#bib.bib13)], Thm. 1)是内容门控递归\(h_t = (1 - g_t) h_{t-1} + g_t x_t\),其中\(g_t = \sigma(\text{Linear}(x_t))\),正是Fig.1 (https://arxiv.org/html/2606.28413#S1.F1)(b)中的自适应但间隙盲细胞。因此在不规则时间序列流上它是间隙盲的,Thm1 (https://arxiv.org/html/2606.28413#Thmtheorem1)约束它:即使经过训练,在\(\Delta\)被馈入经过间隔之前,任何宽度或深度都无法达到最优。一个冻结的SSM通过在其离散化中携带间隔(即Cor.1 (https://arxiv.org/html/2606.28413#Thmcorollary1)的连续时间路径,与内容选择不同的\(\Delta\)选择)*加入*液态类。它们的权重是训练的,而我们的必要性是固定权重的;结果告诉SSM设计者在固定、部署的模型下,在不规则采样时必须保持的一个结构性性质:\(\Delta\)必须携带间隔,而不仅仅是内容。同样的道理适用于冻结的Transformer:在不规则时间序列流上运行的LLM是按步骤索引的,因此是间隙盲的,所以分离在任何规模下都约束它;它需要其估计依赖于间隔,这可以通过液态基底结构性地提供,或者通过将间隔作为输入提供(Cor.1 (https://arxiv.org/html/2606.28413#Thmcorollary1))。 ## 3 设置:模型与基底 本节形式化设置和基底:网格(Def.1 (https://arxiv.org/html/2606.28413#Thmdefinition1)),其每个主体通过构造面临的单主体整合问题(Def.2 (https://arxiv.org/html/2606.28413#Thmdefinition2)),以及将由此产生的异步流整合到一个内部状态的固定权重连续时间基底。基底是一个固定权重机制:移动的是状态,永远不会是权重。第4节 (https://arxiv.org/html/2606.28413#S4)随后展示那个基底*必须*是什么。 ###### 定义 1 (网格;网格智能)。一个*网格*是一组自主主体,没有协调者也没有共享模型。每个主体持有一个私有的、演化的认知状态,*发出*其类型化投影(从不发出状态本身),并通过一个内容门*接纳*它认为相关的来自他人的投影,将它们整合到一个内部状态中。*网格智能*是集体仅通过这些接纳进行的推理和学习,没有中心。那么对于*每个*主体,通过构造保持三个性质:其被接纳的流在由发射主体决定的

相似文章

Mesh-RL:耦合子网格强化学习

arXiv cs.LG

Mesh-RL是一种用于强化学习的空间域分解框架,它将环境划分为重叠的子网格,以加速时序差分学习和长程信用分配,从而在稀疏奖励环境中提高收敛速度和样本效率。

多智能体LLM商议中的隐藏锚点

arXiv cs.AI

本文把多智能体LLM商议建模成一个闭环动力系统,其中每个智能体都拥有隐藏的内部信念(锚点),该锚点持续牵引其观点。文章展示了如何仅从商议数据中恢复这个锚点,并解释了诸如观点逃逸初始信念凸包等现象。

大型语言模型中的推理源于受限推理流形

arXiv cs.LG

本文将大语言模型中的推理视为一种内在的动力学过程,发现推理时的表征会自组织成低维流形。文章提出了一种基于内部动力学的无标签诊断方法,以评估推理质量,表明有效的推理受到几何和信息约束的支配。

Agentic AI 网络中涌现通信的泛化界限

arXiv cs.AI

本文提出了一个用于 Agentic AI 网络(AgentNet)中涌现通信的信息论框架,解决了物理约束问题并提供了泛化界限。在硬件原型上的实验验证表明,与现有最先进的解决方案相比,该框架显著提升了泛化性能。

面向低延迟多智能体工具调用的有状态推理架构

arXiv cs.LG

本文提出了一种用于多智能体工具调用的有状态推理架构,该架构在多次调用之间复用KV缓存,并采用推测解码技术,相较于vLLM和SGLang,在智能体工作流上实现了2.1倍至4.2倍的加速。