数据稀缺下基于强化学习的数字孪生驱动自适应仿真到真实对齐方法用于振动轴承健康监测
摘要
本文提出了一种基于强化学习的自适应仿真到真实对齐方法,用于振动轴承健康监测,通过近端策略优化解决数据稀缺和异质故障类型差距问题。
arXiv:2606.24954v1 公告类型: new
摘要:基于振动的旋转机械健康监测需要在运行数据受限条件下进行可靠的故障诊断,然而条件评估仍面临故障事件结构性稀缺以及数字孪生生成信号中异质仿真到真实差距的挑战。每种故障类型产生具有不同周期、调幅和频谱特性的脉冲,使得特征空间差异在故障类别间本质上是异质的。现有的域自适应方法应用与类别无关的全局变换,无法在不扭曲类间可分性的情况下缩小所有特定故障差距,而均匀的源-目标混合会在数据丰富的正常类中引入分布噪声。这些局限性源于将顺序的、状态相关的对齐问题视为一次性优化。每次校正变换同时重塑所有类别分布,产生状态依赖性,静态梯度下降无法解决。我们将特征对齐形式化为一个连续动作马尔可夫决策过程,通过近端策略优化求解,其中学习到的策略根据当前特征空间配置发出特定故障类型的仿射校正,并采用双目标奖励平衡差距最小化与可分性保持。一种不对称感知策略将真实数据保留给正常类,同时使用策略对齐的模拟样本增强故障类。在XJTU-SY、CWRU和自建回转轴承试验台上的验证证实了强化学习驱动对齐的主导增益,跨设备线性探测在无需编码器重新训练的情况下达到92.8%,展示了可迁移的监测能力。
查看缓存全文
缓存时间: 2026/06/25 05:07
# 基于强化学习的数字孪生驱动自适应仿真到真实对齐方法及其在数据稀缺条件下振动轴承健康监测中的应用 来源:https://arxiv.org/abs/2606.24954 查看PDF(https://arxiv.org/pdf/2606.24954) > **摘要:** 基于振动的旋转机械健康监测需要在运行数据受限的条件下实现可靠的故障诊断,然而条件评估仍面临故障事件结构性稀缺以及数字孪生生成信号中异构的仿真到真实(sim-to-real)差距的挑战。每种故障类型产生的脉冲具有不同的周期性、幅值调制和频谱特性,导致特征空间差异在各类故障间呈现出根本性的异质性。现有的域自适应方法采用与类别无关的全局变换,无法在保持类间可分性的同时弥合所有特定故障的差距,而均匀的源-目标混合则会在数据丰富的正常类中引入分布噪声。这些局限源于将序列化的、状态相关的对齐问题视为一次性优化问题。每一次修正变换都会同时重塑所有类别的分布,产生了静态梯度下降无法解决的状态依赖性。本文将特征对齐形式化为一个连续动作的马尔可夫决策过程,并通过近端策略优化求解,其中学习到的策略会根据当前特征空间配置发出特定故障类型的仿射校正,并以双目标奖励函数平衡差距最小化与可分性保持。一种非对称感知策略将真实数据保留给正常类,同时通过策略对齐的仿真样本扩充故障类。在XJTU-SY、CWRU以及自建回转轴承测试台上的验证表明,强化学习驱动的对齐带来了主导性增益,且跨设备线性探测在无需编码器重训练的情况下达到了92.8%的准确率,展现出可迁移的监测能力。 ## 提交历史 来自:王靖涵 [查看邮箱](https://arxiv.org/show-email/5e0b85bb/2606.24954) **[v1]** 2026年6月23日星期二 08:47:24 UTC(2,236 KB)
相似文章
利用主动学习构建集成热能系统的基于物理的数字孪生
本文提出了一种主动学习框架,将高保真 Modelica 仿真与更简单的代理模型(SINDyC、FNN、GRU)相结合,以创建高效的热能分配系统数字孪生。该方法在保持预测精度和实现不确定性量化的同时,显著减少了所需的仿真轨迹数量。
量子退火增强强化学习用于精确剩余使用寿命预测
本文提出了一种量子退火增强的Q-learning框架,用于剩余使用寿命预测,利用D-Wave系统求解QUBO公式以进行动作选择。在NASA C-MAPSS和预测维护数据集上,它优于经典和量子基线。
用于发动机健康管理与剩余使用寿命预测的科学机器学习
本文提出了一种用于涡轮机预测的多任务科学机器学习框架,该框架使用共享序列编码器和任务特定头,联合预测发动机健康指标和剩余使用寿命,并量化不确定性。
学习何时行动:通过运行时保证的通信高效强化学习
本文提出了一种框架(CARE),该框架在逐点李雅普诺夫安全护罩下联合学习控制输入和通信高效的定时决策,在倒立摆、小车-杆系统和平面四旋翼飞行器上实现了比经典方法更高的采样间隔。
分层优势加权:面向稀疏回合结果的VLA在线强化学习微调
本文提出分层优势加权行为克隆(HABC),用于利用具有稀疏二进制回合结果的在线强化学习微调视觉-语言-动作(VLA)策略。HABC通过自适应评价器头和干预感知的信用分配将可行性和效率目标分离,显著提高了接触密集型双手操作任务的成功率。