迈向弹性与自主网络:AI原生6G的BlueSky愿景

arXiv cs.AI 论文

摘要

本文提出了一个面向AI原生6G网络的愿景框架,主张采用统一的基础模型和协作式多智能体系统,以实现超越碎片化5G方案的自主、弹性网络管理。

arXiv:2605.21395v1 公告类型:新论文 摘要:新兴应用(如自动驾驶和沉浸式体验)的激增,要求蜂窝网络不仅要更快,而且要从根本上更具弹性和自主性。本文提出了一个关于人工智能如何原生集成到6G中的BlueSky愿景,将范式从\underline{网络为AI}转变为\underline{AI为网络}。我们设想,与5G依赖零散的、针对单一任务训练的临时模型不同,6G时代的原生AI将由一个基础模型锚定,并通过协作式多智能体系统进行编排,将网络管理定义为一个统一的、多模态、多任务的优化问题。基于这一愿景,我们概述了两个变革方向。第一个方向专注于开发一个6G基础模型作为统一骨干,将特定任务的知识蒸馏为适用于各种边缘部署的紧凑模型。第二个方向推进多智能体系统,旨在以最少的人工干预自主诊断、维护和恢复网络。这些方向为6G演变为智能、自维持的通信基础设施绘制了路线图。
查看原文
查看缓存全文

缓存时间: 2026/05/22 08:50

# AI原生6G的蓝天愿景
来源:https://arxiv.org/html/2605.21395
## 迈向弹性自治网络:AI原生6G的蓝天愿景

Liang Wu, Kelly Wan, Mayank Darbari, and Liangjie Hong

###### 摘要

自动驾驶、沉浸式体验等新兴应用的激增,要求蜂窝网络不仅更快,更要在根本上更具弹性和自治性。本文提出了一项关于人工智能如何原生融入6G的蓝天愿景,将范式从"网络支持AI"转变为"AI赋能网络"。我们设想,与5G依赖分散、即用即建、每个仅针对单一任务训练的模型不同,6G时代的原生AI将由一个基础模型支撑,并通过协作式多智能体系统进行编排,将网络管理视为一个统一的多模态、多任务优化问题。基于这一愿景,我们概述了两个变革方向。第一个方向聚焦于开发一个6G基础模型作为统一骨干,将任务特定知识蒸馏为适合各种边缘部署的紧凑模型。第二个方向推进多智能体系统,旨在以最少的人工干预自主诊断、维护和恢复网络。这些方向为6G演变为智能、自维持的通信基础设施绘制了路线图。

††会议:第32届ACM SIGKDD知识发现与数据挖掘会议;2026年8月9日至13日,韩国济州岛
††论文集:第32届ACM SIGKDD知识发现与数据挖掘会议论文集 (KDD '26)

## 1. 引言

机器学习在蜂窝网络中的集成已在5G和5G-Advanced时代展示了令人瞩目的成效(Shahid等人,2025 (https://arxiv.org/html/2605.21395#bib.bib36))。任务特定模型已被证明能够改善广泛的网络功能,包括流量预测、波束赋形优化和切换预测。然而,当我们展望6G时,对无线基础设施的需求已远超单纯更快地将比特从一点传输到另一点。自动驾驶、无人飞行器和智能可穿戴设备等新兴应用带来了定性上全新的要求。例如,网络必须感知设备位置、推断蜂窝网络用户的状态,并应对前几代网络中史无前例的故障模式(Tataria等人,2021 (https://arxiv.org/html/2605.21395#bib.bib39);Chataut等人,2024 (https://arxiv.org/html/2605.21395#bib.bib9))。像5G-Advanced中普遍的做法那样(Chen等人,2023 (https://arxiv.org/html/2605.21395#bib.bib11)),通过为每个需求训练一个专用、即用即建的模型,会导致一个脆弱且成本高昂的生态系统。大量狭窄模型的激增增加了开发开销,使维护复杂化,并且当一个模型的输出作为另一个模型的输入时,会引入细微的不兼容性。更根本的是,分散的、单一目标的模型集合无法在吞吐量、延迟、能效和用户体验这些竞争性网络目标需要实时联合优化时,对其进行连贯的平衡。

为了应对这些挑战,我们提出了一个以两个互补支柱为中心的愿景。第一个支柱是6G基础模型:一个统一的多模态模型,能够联合处理异构输入——自然语言、原始无线信号、定位数据以及来自连接设备的传感器流。该基础模型不是维护一个碎片化的任务特定模型库,而是作为一个共享的知识骨干,通过微调可以衍生出任务特定行为,并通过针对各种边缘设备资源约束定制的知识蒸馏获得高效、可部署的变体。这种设计整合了跨模块的语义理解,降低了开发和维护成本,并确保了模块间的连贯通信。第二个支柱是一个多智能体系统,它将基础模型的智能转化为协调的网络行动。各个智能体在接入网、核心网和传输网等网络域中并行运行,自主处理维护、配置和恢复任务。这两个支柱构成了我们对AI原生6G的愿景:一个系统,其中统一的基础模型解决了知识整合的挑战,多智能体架构解决了行动协调的挑战,共同实现更具弹性和自治性的网络。表1 (https://arxiv.org/html/2605.21395#S1.T1) 总结了5G与我们所提出的6G AI原生愿景在三个维度上的关键区别。与将AI视为孤立任务的附加功能的5G不同,6G原生集成了统一的基础模型和自主的多智能体系统,将范式从"支持AI的网络"转变为根本性的"AI原生网络"。

表1. 5G与所提出的6G AI原生愿景的比较
## 2. 愿景:6G基础模型

一个真正AI原生的6G网络需要一种新型模型——它并非由任务特定模块库拼凑而成,而是从根本上构建,以反映电信工作负载的多样性、规模性和关键性。我们设想一个围绕三个定义性属性组织的6G基础模型。首先,它必须是多模态的,能够原生摄取并对定义现代无线网络的异构数据流进行联合推理:原始信号测量、时间序列遥测数据以及来自连接设备的时空轨迹。其次,它必须是多任务的,不仅能执行此前工作中熟悉的预测任务,还能执行异常检测、根因分析以及人类可读的解释性推理——所有这些都在统一的模型内完成。第三,它必须支持高效适配,作为一个通用骨干,可以快速专业化、压缩或蒸馏,以满足从核心网控制器到最受限的边缘设备等不同部署场景的严格延迟和资源约束。这三个属性定义的不仅仅是对现有模型的渐进式改进,而是对智能如何嵌入网络的一次定性重构。

### 2.1. 多模态电信理解

当前电信导向基础模型的主导范式是通过在领域特定语料库(技术标准、配置日志和操作手册)上进行微调,将大型语言模型适配到电信领域(Qu等人,2025 (https://arxiv.org/html/2605.21395#bib.bib33);Chen等人,2025 (https://arxiv.org/html/2605.21395#bib.bib10);Maatouk等人,2024 (https://arxiv.org/html/2605.21395#bib.bib24);Zhou等人,2024 (https://arxiv.org/html/2605.21395#bib.bib45))。虽然这种方法产生了对网络概念具备有用语言流畅性的模型,但它本质上仍然是一个语言建模练习。这类模型不适合AI原生6G的核心需求,后者关注的不是文本理解,而是对无线介质原生的原始网络信号、传感器流和时空数据进行实时解释。

时间序列基础模型(TSFMs)代表了一个更有希望的起点,然而现有对电信数据集的基准测试揭示了一致的性能差距:主要在气象、金融或物联网传感器数据上训练的模型未能有效迁移到电信工作负载(Feng等人,2025 (https://arxiv.org/html/2605.21395#bib.bib13))。两个结构性因素解释了这一差距。首先是数据不匹配:公开的TSFM训练语料库中电信来源信号的数量可以忽略不计,而网络流量的统计特性——突发性、非平稳性、由众多同时用户行为的叠加驱动——与这些模型所设计的低维、平滑时间序列显著不同(Ansari等人,2024 (https://arxiv.org/html/2605.21395#bib.bib6), 2025 (https://arxiv.org/html/2605.21395#bib.bib5);Liu等人,2025 (https://arxiv.org/html/2605.21395#bib.bib23);Cohen等人,2024 (https://arxiv.org/html/2605.21395#bib.bib12))。其次是架构不匹配:标准的TSFM分词策略,例如基于补丁的分割(Ansari等人,2024 (https://arxiv.org/html/2605.21395#bib.bib6), 2025 (https://arxiv.org/html/2605.21395#bib.bib5);Liu等人,2025 (https://arxiv.org/html/2605.21395#bib.bib23);Cohen等人,2024 (https://arxiv.org/html/2605.21395#bib.bib12)),是为能够被少量潜在因素(温度、湿度、季节效应)良好近似的信号设计的。电信数据本质上是高秩的:跨一个扇区聚合的流量矩阵反映了数百到数千用户的同时行为,每个用户都遵循独立的行为动态。基于补丁的分词器会折叠这种结构,丢弃携带诊断信息的跨变量相关性(Feng等人,2025 (https://arxiv.org/html/2605.21395#bib.bib13))。因此,电信基础模型需要新的架构原语:为高秩、高频多变量信号设计的分词器;显式建模跨天线端口或频段的协变量关系的注意力机制;以及能够产生自回归输出和量化离散预测的解码策略,正如Chronos-2等新兴方法已经开始探索的那样。

除了时间序列遥测数据,6G生态系统还引入了额外一层模态复杂性。随着6G网络集成密集的传感器基础设施以支持自动驾驶车辆(He等人,2020 (https://arxiv.org/html/2605.21395#bib.bib14))、无人航空系统(Shrestha等人,2021 (https://arxiv.org/html/2605.21395#bib.bib37))和扩展现实应用(Yu等人,2023 (https://arxiv.org/html/2605.21395#bib.bib41);Ahmad等人,2023 (https://arxiv.org/html/2605.21395#bib.bib3)),基础模型必须对三维时空数据进行推理——位置轨迹、速度场和移动模式——其几何结构与一维时间序列毫无相似之处。这些轨迹在物理空间中展开,带有明确的坐标结构,并要求适合其空间语义的架构处理,无论是通过几何编码器、基于图的设备邻域表示,还是坐标感知的注意力机制。一个不能原生处理这种时空模态的6G基础模型将系统性地忽视新一代网络中最具独特性的AI需求,后者强调将边缘设备与关注位置和轨迹的远程传感器连接起来。

### 2.2. 多任务电信推理

现有的时间序列基础模型大多围绕一个单一规范目标设计:预测下一个时间步或下一个时间步补丁(Kottapalli等人,2025 (https://arxiv.org/html/2605.21395#bib.bib16))。这种框架将预测准确度视为主要成功标准,并且非常适合预测是最终目标的领域。然而,电信是一个预测很少足够的领域。网络运营中心不仅仅想知道未来十分钟的流量会是什么样;它还需要知道什么时候出了问题,为什么出问题,以及应该对此做些什么。

这个更广泛的任务空间需要一个在训练时同时具备异常感知能力,并在推理时能够进行结构化因果推理的模型。挑战尤为严峻,因为电信时间序列本质上是高维的:单个网络事件可能表现为跨协议栈多层数十个相关指标的协调偏差(Sun等人,2024 (https://arxiv.org/html/2605.21395#bib.bib38))。在5G网络中,这种故障诊断已经让人类操作员不堪重负;在6G中,数据量和来源多样性大幅增加,没有自动化支持,这变得几乎难以处理。我们设想一个6G基础模型,在正常操作模式和故障特征上同时接受明确的监督训练,使其不仅能够标记偏差,还能追踪偏差在依赖子系统间的传播,并生成关于可能根因的人类可读解释。这种从准确预测到可解释因果叙述的转变,对于实现6G设计理念——从"人类作为执行者"转变为"人类作为监督者"(Pang等人,2026 (https://arxiv.org/html/2605.21395#bib.bib27))——至关重要。

多任务的要求超越时间序列遥测数据,延伸到上述的时空模态。当基础模型监控无人飞行器的轨迹(Yang等人,2024 (https://arxiv.org/html/2605.21395#bib.bib40))或自动驾驶车辆的移动模式(Baccari等人,2024 (https://arxiv.org/html/2605.21395#bib.bib7))时,它必须同时维护正常行为的预测模型和对可能预示机械故障、对抗性干扰或环境扰动的偏差敏感的异常检测器。这些任务并非独立:准确的轨迹预测提高了异常敏感性,而异常检测提供了反馈来改进生成模型。一个耦合这些目标的统一基础模型架构——而不是为预测和检测维护单独的模型——自然地捕捉了这种相互依赖性,并支持高风险6G应用所需的联合优化类型。

### 2.3. 高效适配与部署

将多样化能力整合到单一基础模型中,在开发和维护方面带来了显著的效率优势,但同时也引入了一个互补的挑战:模型必须快速可靠地专业化以服务于特定的运营环境,并且必须足够轻量化,以便在表征真实6G部署(Zeeshan等人,2025 (https://arxiv.org/html/2605.21395#bib.bib42))的异构硬件环境中运行。

专业化需求出现在两个维度上。首先,运营场景可能要求对特定任务类型提高精度:管理高价值企业流量的核心网控制器可能需要远超基线性能的异常检测灵敏度,而服务于密集城市场所的边缘节点可能优先考虑对延迟敏感的负载预测。我们设想的是无需从头重新训练,而是采用能力特定微调流水线,可以有选择地增强目标能力——自动策划对该能力最具信息量的训练信号,或应用结构化微调仅更新与其最相关的参数。这第二条路径又连接到神经网络模型可解释性的更广泛计划:理解基础模型中哪些电路实现了哪些功能,使得将微调更新路由到将产生最大效果的地方成为可能(Lei等人,[n.d.] (https://arxiv.org/html/2605.21395#bib.bib20)),并可以剪枝在给定部署环境中无关或适得其反的功能(Zhang等人,2025 (https://arxiv.org/html/2605.21395#bib.bib43))。

其次,推理效率是电信中的首要约束。许多网络功能在严格的延迟预算下运行,而大型

相似文章

从自动化到自主化:分层智能体原生网络架构 (HANA)

arXiv cs.AI

本文提出了一种名为HANA的分层多智能体参考架构,旨在实现4级/5级自主网络。它集成了智能体自我意识,以协调战略治理与反射性故障恢复,并在5G核心网络环境中验证,实现了平均修复时间减少86%。

Agentic AI 网络中涌现通信的泛化界限

arXiv cs.AI

本文提出了一个用于 Agentic AI 网络(AgentNet)中涌现通信的信息论框架,解决了物理约束问题并提供了泛化界限。在硬件原型上的实验验证表明,与现有最先进的解决方案相比,该框架显著提升了泛化性能。

网络上的大型语言模型:资源受限下的协作智能

Hugging Face Daily Papers

本文探讨了分布式大型语言模型(LLMs)如何在设备和云端之间协同工作以应对资源限制的协作智能范式。文章涵盖了垂直方向的设备-云端协作、水平方向的多智能体协作、路由策略,以及在可扩展且可信的协作式人工智能方面的开放研究挑战。