EdgeDetect:用于联邦入侵检测的重要性感知梯度压缩与同态聚合
摘要
# 论文页面 - EdgeDetect:用于联邦入侵检测的重要性感知梯度压缩与同态聚合 来源:[https://huggingface.co/papers/2604.14663](https://huggingface.co/papers/2604.14663) ## [https://huggingface.co/papers/2604.14663#edgedetect-importance-aware-gradient-compression-with-homomorphic-aggregation-for-federated-intrusion-detection](https://huggingface.co/papers/2604.14663#edgedetect-importance-aware-gradient-compression-fo
查看缓存全文
缓存时间: 2026/04/21 07:21
论文页面 - EdgeDetect:面向联邦入侵检测的重要性感知梯度压缩与同态聚合
Source: https://huggingface.co/papers/2604.14663
https://huggingface.co/papers/2604.14663#edgedetect-importance-aware-gradient-compression-with-homomorphic-aggregation-for-federated-intrusion-detectionEdgeDetect:面向联邦入侵检测的重要性感知梯度压缩与同态聚合
**作者:**Noor Islam S. Mohammad **机构:**伊斯坦布尔技术大学计算机系,Maslak, TR 邮箱:[email protected] **arXiv:**2604.14663v1 [cs.CR] **日期:**2026年4月16日
https://huggingface.co/papers/2604.14663#abstract[摘要]
联邦学习(FL)使得在不交换原始数据的情况下实现协作式入侵检测成为可能,但传统 FL 因全精度梯度传输而产生高昂的通信开销,并且仍易受梯度推理攻击。本文提出了EdgeDetect,这是一种面向带宽受限的 6G-IoT 环境、兼顾通信效率与隐私保护的联邦入侵检测系统。
EdgeDetect 引入了梯度智能量化(gradient smartification),这是一种基于中位数的统计二值化方法,将本地更新压缩为 {+1, -1} 表示形式,在保持收敛性的同时将上行载荷降低32 倍。我们进一步在二值化梯度的基础上集成了 Paillier 同态加密,以防范“诚实但好奇”的服务器,同时避免暴露单个客户端的更新内容。
关键结果:
- 在 CIC-IDS2017 数据集(280 万流量样本,7 类攻击)上实现98.0% 的多分类准确率和97.9% 的宏观 F1 分数
- 96.9% 的通信开销降低(每轮从 450 MB 降至 14 MB)
- 树莓派 4 部署:仅需 4.2 MB 内存,0.8 ms 延迟,每次推理功耗 12 mJ,准确率损失小于 0.5%
- 鲁棒性:在 5% 的投毒攻击下仍保持 87% 的准确率,少数类 F1 分数达 0.95(p < 0.001)
**索引词:**PPFL、IDS、边缘计算、6G 安全、物联网网络、通信效率、机器学习
https://huggingface.co/papers/2604.14663#1-introduction[引言]
下一代无线技术(5G、6G、IoT)在实现海量机器类型通信的同时,也扩大了复杂网络威胁的攻击面。传统的集中式 IDS 面临以下挑战:
- 可扩展性瓶颈
- 通信延迟高
- 单点故障风险
- 难以处理高维数据和严重的类别不平衡问题
联邦学习虽能缓解上述问题,但仍面临两大核心挑战:
- 通信开销——高维梯度向量消耗大量带宽
- 梯度泄露——共享的更新内容可能被逆向工程还原出敏感的原始训练样本
https://huggingface.co/papers/2604.14663#contributions[主要贡献]
https://huggingface.co/papers/2604.14663#1-alignment-aware-federated-ids-architecture1.对齐感知的联邦 IDS 架构
- 面向 6G-IoT 的隐私保护型联邦入侵检测框架
- 集成基于 PCA 的降维、均衡采样策略与安全聚合机制
- 实现无需共享原始网络流量的协作式学习
https://huggingface.co/papers/2604.14663#2-adaptive-median-based-gradient-smartification-with-encrypted-aggregation2.基于自适应中位数的梯度智能量化与加密聚合
- 基于统计特性的自适应中位数阈值二值化策略
- 将梯度压缩至 {+1, -1},同时保持方向一致性
- 结合 Paillier 同态加密技术
- 实现最高 32 倍的通信缩减,有效缓解梯度反转风险
https://huggingface.co/papers/2604.14663#3-quantified-privacyutilityefficiency-trade-off3.隐私-效用-效率权衡的量化评估
- 开展广泛的消融实验与对抗性分析
- 通信开销降低 96.9% 的情况下,多分类准确率达 98.0%
- 性能可与集中式基线模型相媲美
- 提供密码学级别的隐私保障
- 即使存在 20% 的恶意客户端,仍能保持 >85% 的准确率
- 将梯度反演 PSNR 从 31.7 dB 降低至 15.1 dB
https://huggingface.co/papers/2604.14663#4-edge-validated-deployment4.边缘端实际部署验证
- 在树莓派 4 上进行真实世界部署
- 内存占用仅 4.2 MB,延迟低至 0.8 ms
- 每次推理功耗 12 mJ,准确率下降不足 0.5%
- 充分验证了其在资源受限的 6G-IoT 环境中的适用性
https://huggingface.co/papers/2604.14663#2-related-work[相关工作]
https://huggingface.co/papers/2604.14663#a-deep-learning-based-anomaly-detection[A. 基于深度学习的异常检测]
- 采用 CNN-RNN 与 LSTM 架构进行 DDoS 与零日攻击检测
- 将时序流量转换为图像编码以提取空间特征
- 对于结构化特征,SVM 与随机森林仍具有较强竞争力
https://huggingface.co/papers/2604.14663#b-federated-learning-in-iot-networks[B. 物联网网络中的联邦学习]
- 实现无需共享原始数据的去中心化训练
- 应用场景涵盖 IoT 安全、工业传感器网络及跨域入侵检测
- “边缘-云”协同架构可降低响应延迟
- 挑战在于标准 FL(如 FedAvg)依赖全精度梯度交换
https://huggingface.co/papers/2604.14663#c-privacy-preservation-and-gradient-compression[C. 隐私保护与梯度压缩]
- **差分隐私(DP)与同态加密(HE)**可提升数据机密性
- 高效通信方法包括 signSGD 与梯度稀疏化
- 目前较少方法能联合优化梯度压缩与加密聚合过程
https://huggingface.co/papers/2604.14663#d-distinction-from-signsgd-and-quantized-fl[D. 与 signSGD 及量化 FL 的区别]
与固定阈值量化器(QSGD, TernGrad)不同:
- 客户端自适应阈值可动态适应梯度分布
- 保留梯度向量内的相对顺序
- 利用 IDS 模型中典型的长尾分布特性
https://huggingface.co/papers/2604.14663#3-system-architecture[系统架构]
https://huggingface.co/papers/2604.14663#protocol-flow[协议流程]
EdgeDetect 由 K 个资源受限的边缘客户端和一个中央聚合服务器组成。
https://huggingface.co/papers/2604.14663#phase-1-client-side-local-training[阶段一:客户端本地训练]
W_{i}^{(r+1)} = W_{i}^{(r)} − η∇L(W_{i}^{(r)}, D_i)
Δ_{i}^{(r)} = W_{i}^{(r+1)} − W^{(r)}
https://huggingface.co/papers/2604.14663#phase-2-gradient-smartification[阶段二:梯度智能量化]
θ_i = median(|Δ_{i}^{(r)}|)
Δ^{bin}_{i,j} = +1 if Δ_{i,j} ≥ θ_i
-1 otherwise
https://huggingface.co/papers/2604.14663#phase-3-privacy-preserving-encryption[阶段三:隐私保护加密]
C_{i}^{(r)} = E(Δ^{bin}_{i}) # Paillier 加密
https://huggingface.co/papers/2604.14663#phase-4-secure-aggregation-and-global-update[阶段四:安全聚合与全局更新]
Δ^{bin}_{agg} = (1/|S_r|) × Σ D(C_{i}^{(r)})
W^{(r+1)} = W^{(r)} + α · Δ^{bin}_{agg}
https://huggingface.co/papers/2604.14663#4-methodology[方法论]
https://huggingface.co/papers/2604.14663#a-data-exploration-and-preprocessing[A. 数据探索与预处理]
CIC-IDS2017 数据集:
- 包含 79 个特征的 2,830,743 条记录
- 剔除 308,381 行重复数据
- 缺失/无穷值占比 0.06%(使用中位数填充)
- 通过数值类型降级节省 47.5% 内存
- 缓解严重类别不平衡问题:采用 20% 分层抽样
https://huggingface.co/papers/2604.14663#b-feature-engineering-and-selection[B. 特征工程与选择]
https://huggingface.co/papers/2604.14663#temporal-features[时间特征]
Δt_mean = (1/(n-1)) × Σ(t_i − t_{i-1})
Δt_std = √[(1/(n-1)) × Σ(Δt_i − Δt_mean)²]
https://huggingface.co/papers/2604.14663#entropy-based-features[基于熵的特征]
H(S) = −Σ p(s) log₂ p(s)
捕捉数据包尺寸的分布随机性。
https://huggingface.co/papers/2604.14663#feature-selection[特征选择]
- 使用基于随机森林置换重要性的递归特征消除(RFE)
- 排序公式:I_j = (1/T) × Σ I(f_t(D) ≠ f^{-j}_t(D))
https://huggingface.co/papers/2604.14663#c-dimensionality-reduction-via-incremental-pca[C. 通过增量 PCA 进行降维]
Cov(Z) = (1/(n-1)) × Z^T Z = V Λ V^T
Z_PCA = Z V_k
结果:主成分数量从 78 降至 35,在保留99.3% 方差的同时将特征维度降低 55%。
https://huggingface.co/papers/2604.14663#d-class-balancing-strategies[D. 类别平衡策略]
https://huggingface.co/papers/2604.14663#binary-classification[二分类任务]
- 随机欠采样:D_bal = D_min ∪ Sample(D_max, |D_min|)
- 结果:生成 15,000 个平衡样本(7,500 正常,7,500 攻击)
https://huggingface.co/papers/2604.14663#multi-class-classification[多分类任务]
- SMOTE:x_new = x_i + λ(x_{ij} − x_i),其中 λ ~ U(0, 1)
- 自适应 SMOTE:λ ~ Beta(α, β),其中 α = 1 + ρ_i,β = 1 + (1 − ρ_i)
https://huggingface.co/papers/2604.14663#e-machine-learning-models[E. 机器学习模型]
| 模型 | 配置 |
|---|---|
| 逻辑回归(弹性网) | α = 0.01, ρ = 0.5 |
| 支持向量机(RBF 核) | γ = 0.001, C = 1.0 |
| 随机森林 | T = 100 棵树,最大深度 20 |
| 梯度提升树 | ν = 0.1 |
| 神经网络(MLP) | 结构 35 → 128 → 64 → K,dropout=0.5,Adam 优化器 |
https://huggingface.co/papers/2604.14663#f-evaluation-metrics[F. 评估指标]
- 准确率、精确率、召回率、F1 分数
- Matthews 相关系数(MCC)
- Cohen’s Kappa (κ)
- ROC 曲线下面积(AUC-ROC)
https://huggingface.co/papers/2604.14663#5-experimental-setup[实验设置]
https://huggingface.co/papers/2604.14663#a-dataset-construction-and-sampling-validation[A. 数据集构建与抽样验证]
CIC-IDS2017 抽样情况:
- 原始数据:N = 2,830,540 条流量
- 20% 分层子集:n = 504,472
- Kolmogorov–Smirnov 检验:p > 0.05(无显著偏离)
- 92% 的特征平均偏差 <5%
- 经 PCA 后:k = 35 个主成分(保留 99.3% 方差)
训练集-测试集划分:
- 80:20 分层划分(随机种子 42)
- 二分类:15,000 个样本(7,500 正常,7,500 攻击)
- 多分类:通过 SMOTE 生成 35,000 个样本(每类 5,000 个)
https://huggingface.co/papers/2604.14663#b-hyperparameter-optimization[B. 超参数优化]
配置方案:
- 配置 1(效率优先):侧重计算效率
- 配置 2(表达能力优先):通过 3 折网格搜索最大化准确率
关键超参数:
- 逻辑回归:C ∈ {0.1, 100}
- SVM:RBF 核函数,γ = 0.1
- 随机森林:n_estimators ∈ {100, 200},max_depth=20
- 决策树:max_depth ∈ {6, 10, 15}
- KNN:k ∈ {3, 5, 7}
https://huggingface.co/papers/2604.14663#c-evaluation-protocol[C. 评估协议]
https://huggingface.co/papers/2604.14663#stage-1-cross-validation[阶段一:交叉验证]
- 在训练集划分(n = 12,000)上执行 5 折分层交叉验证
- 分层策略保持 50:50 的正常与攻击样本比例
- 折间波动性:σ_CV = √[(1/(K-1)) × Σ(Acc_i − Acc̄)²]
https://huggingface.co/papers/2604.14663#stage-2-hold-out-testing[阶段二:留置测试]
- 使用最优配置在全量训练集上重新训练模型
- 在留置测试集(n = 3,000,占 20%)上进行评估
- 评估指标:准确率、精确率、召回率、F1 分数、ROC-AUC、混淆矩阵
https://huggingface.co/papers/2604.14663#statistical-reliability[统计可靠性]
- 三次独立随机实验,种子分别为 42、123、456
- 95% 置信区间:CI_95% = x̄ ± 1.96 × (σ/√n)
https://huggingface.co/papers/2604.14663#6-experimental-results[实验结果]
https://huggingface.co/papers/2604.14663#a-binary-classification-performance[A. 二分类性能表现]
https://huggingface.co/papers/2604.14663#linear-models[线性模型]
- 逻辑回归:92.21% 准确率(σ = 5.81 × 10⁻³)
- 配置 2 优化后提升至 92.51%(+0.30%)
https://huggingface.co/papers/2604.14663#kernel-based-methods[基于核的方法]
- SVM(线性核):83.00%(欠拟合)
- SVM(RBF 核):96.14%(+13.14%,σ = 3.89 × 10⁻³)
https://huggingface.co/papers/2604.14663#tree-based-ensembles[基于树的集成模型]
- 随机森林(配置 1):95.98%
- 随机森林(配置 2):98.09%(+2.11%,σ = 1.72 × 10⁻³)✓最佳
https://huggingface.co/papers/2604.14663#instance-based-learning[基于实例的学习]
- KNN(k=5):97.40%(σ = 0.89 × 10⁻³)
- KNN(k=3):97.93%(+0.53%,σ = 1.27 × 10⁻³)
https://huggingface.co/papers/2604.14663#b-multi-class-classification-performance[B. 多分类性能表现]
| 模型 | CV 准确率 | 测试准确率 | 精确率 | 召回率 | F1 分数 |
|---|---|---|---|---|---|
| 随机森林 (T=10, d=6) | 96.0±0.009 | 97.1 | 96.9 | 97.0 | 96.9 |
| 随机森林 (T=15, d=8, m=20) | 98.0±0.007 | 98.0 | 97.9 | 98.0 | 97.9 |
| 决策树 (d=10) | 96.0±0.012 | 90.3 | 90.1 | 90.2 | 90.1 |
| KNN (k=7, distance-weighted) | 94.0±0.014 | 95.2 | 95.0 | 95.3 | 95.1 |
https://huggingface.co/papers/2604.14663#c-per-class-breakdown-random-forest-config-2[C. 各类别详细表现(随机森林配置 2)]
| 攻击类别 | 精确率 | 召回率 | F1 分数 |
|---|---|---|---|
| BENIGN | 99.2% | 98.5% | 98.9% |
| DoS | 98.8% | 99.0% | 98.9% |
| DDoS | 98.6% | 98.9% | 98.7% |
| Port Scan | 95.7% | 97.6% | 96.6% |
| Brute Force | 95.1% | 97.5% | 96.3% |
| Web Attack | 91.9% | 96.0% | 93.9% |
| Bot | 90.2% | 95.3% | 92.7% |
https://huggingface.co/papers/2604.14663#7-federated-learning-convergence-analysis[联邦学习收敛性分析]
https://huggingface.co/papers/2604.14663#a-convergence-and-compression-trade-off[A. 收敛性与压缩权衡]
EdgeDetect 在压缩 32 倍的情况下实现了与全精度 FedAvg相当的收敛水平:
- 覆盖 280 万 CIC-IDS2017 样本
- 无明显准确率下降(Δ < 0.2 个百分点)
- 余弦相似度:0.87 ± 0.04
https://huggingface.co/papers/2604.14663#b-privacy-enhancement-through-smartification[B. 智能量化带来的隐私增强]
| 方法 | 技术 | PSNR (dB) | 标签恢复程度 |
|---|---|---|---|
| FedAvg (无防御) | 无 | 31.7 | 高保真还原 |
| signSGD | 零阈值 | 16.8 | 部分恢复 |
| EdgeDetect | 中位数阈值 | 15.1 | 14.3%(随机水平) |
https://huggingface.co/papers/2604.14663#c-theoretical-convergence-analysis[C. 理论收敛性分析]
引理 1(中位数阈值智能量化下的下降性质): 假设损失函数 L(W) 是 L-平滑且有下界的。令 g̃_t 表示智能量化后的梯度,其余弦相似度满足 cos(θ_t) = ⟨g_t, g̃_t⟩ / (∥g_t∥ ∥g̃_t∥) ≥ γ > 0。
当学习率 η 足够小时:
E[L(W_{t+1})] ≤ L(W_t) − ηγ∥g_t∥² + (Lη²/2)∥g̃_t∥²
定理 1(有界方差下的收敛性): 假设随机梯度方差 σ² 有界,且余弦相似度 γ > 0。则在 T 轮迭代后:
min_{t≤T} E[∥∇L(W_t)∥²] = O(1 / (γ√T))
https://huggingface.co/papers/2604.14663#8-federated-learning-scalability[联邦学习扩展性]
https://huggingface.co/papers/2604.14663#a-convergence-under-different-heterogeneity-levels[A. 不同异构水平下的收敛性]
| 数据分布 | 客户端数 K=50 | R95 | R98 | 准确率 | 带宽 |
|---|---|---|---|---|---|
| IID | FedAvg | 142 | 287 | 98.2% | 129.15 GB |
| EdgeDetect | 145 | 289 | 98.0% | 4.05 GB | |
| Non-IID (α=1.0) | FedAvg | 201 | 423 | 96.4% | 190.35 GB |
| EdgeDetect | 192 | 398 | 96.8% | 5.57 GB | |
| Non-IID (α=0.1) | FedAvg | 312 | 687 | 93.8% | 309.15 GB |
| EdgeDetect | 287 | 612 | 94.2% | 8.57 GB | |
| EdgeDetect+FedProx | 264 | 563 | 95.1% | 7.88 GB |
https://huggingface.co/papers/2604.14663#b-scalability-with-number-of-clients[B. 客户端数量扩展性]
| 客户端数 K | IID 分布 | R98 | 准确率 | 总带宽 |
|---|---|---|---|---|
| 10 | IID | 201 | 98.1% | 2.8 |
相似文章
使用梯度指纹检测和抑制奖励黑客攻击
本文介绍了梯度指纹(Grift)方法,用于在具有可验证奖励的强化学习中检测奖励黑客攻击。该方法通过分析模型内部梯度计算而非表面推理迹象来工作。在数学、代码和逻辑推理基准上,隐式奖励黑客攻击的检测相对改进超过25%。
在日用设备上启用隐私保护型 AI 训练
麻省理工学院研究人员开发了一种名为 FTTE 的新框架,将隐私保护型联邦学习的速度提升了 81%,使得在智能手表和传感器等资源受限的边缘设备上高效进行 AI 训练成为可能。
Isolation Forest + eBPF 事件打造 Linux 端点检测系统 [项目]
guardd 是一款开源 Linux 端点检测工具,利用 eBPF 事件与 Isolation Forest 在 60 秒窗口内发现异常进程/网络行为,但对浏览器类误报较敏感。
你认为边缘AI在自主系统、机器人技术还是本地私有推理中更具意义?
一篇探讨边缘AI在何处产生最大影响的讨论帖:自主系统与机器人技术、低功耗视觉系统、私有本地LLM,或带宽受限的工业部署。
AEGIS —— 在自主AI漏洞发现时代实现集体、分布式且可问责的网络防御框架
AEGIS 是一个拟议的开放框架,用于构建集体治理、分布式的 AI 网络防御体系,以应对新兴的自主漏洞发现威胁;该威胁由 Anthropic 尚未发布的 Claude Mythos 模型触发,该模型一次性挖掘出大量零日漏洞。