Data alignments in machinery remaining useful life prediction using deep adversarial neural networks
a b s t r a c t
Recently, intelligent data-driven machinery prognostics and health management have been attracting increasing attention due to the great merits of high accuracy, fast response and easy implementation. While promising prognostic performance has been achieved, the first predicting time for remaining useful life is generally difficult to be determined, and the data distribution discrepancy between different machines is mostly ignored, which leads to deterioration in prognostics. In this paper, a deep learning-based prognostic method is proposed to address the problems. Generative adversarial networks are used to learn the distributions of data in machine healthy states, and a health indicator is proposed to determine the first predicting time. Afterwards, adversarial training is further introduced to achieve data alignments of different machine entities in order to extract generalized prognostic knowledge. Experiments of remaining useful life prediction on two rotating machinery datasets are implemented, and the promising prognostic results validate the effectiveness of the proposed method.
- Introduction
Prognostics and health management (PHM) of rotating machines are of great importance in modern industries, which enhance machinery reliability, reduce maintenance costs and increase operating safety [1–6]. In the past years, PHM has been receiving growing research interests especially in the advanced industries such as intelligent manufacturing, aero-space industry etc. As one of the key components in rotating machines, PHM of rolling element bearings (REB) has been widely investigated in the literature. In general, the machinery condition monitoring data such as vibration signals are collected for evaluation of the facility degradation level, and the remaining useful life (RUL) before equipment failure is predicted for prognostics [6–10]. Conventionally, the RUL of bearings can be estimated based on the American Bearing Manufacturers Association (ABMA) standard life rating formula [11] etc. However, as the rotating machines are becoming more and more complex, the traditional methods have been less effective in RUL predictions, and accurate and reliable prognostic methods have always been highly demanded in real industries [12–14].
In the literature, the existing methods on rolling bearing RUL estimations generally fall into two groups, i.e. model-based [15, 16] and data-driven methods [17]. Model-based approaches are developed based on the physical laws and math functions describing the degradation behavior of the system [13,18]. Despite the effectiveness of the model-based methods in the cases where the system health states are well represented [19], the physical models are usually difficult to be developed especially for the complex machines [20]. On the other hand, the data-driven methods mostly aim to capture the direct relationship between condition monitoring data and machine degradation status with artificial intelligence. Little expert knowledge is usually required, that facilitates industrial applications. In the past years, the datadriven approaches such as neural network (NN) [21], support vector machine (SVM) [22], neuro-fuzzy systems [23] etc., have been widely developed due to the great merits of easy implementation, fast response and promising prognostic performance. However, it should be pointed out that the main limitation in most data-driven prognostic methods lies in the inherent data dependency. Large amounts of training data are basically required for model establishment in most cases, and the quality of collected data directly affects the prognostic performance of data-driven methods.
Currently, with the significant growth of collected industrial data and rapid development of computing hardwares and algorithms, it is becoming more and more promising for applications of the data-driven prognostic methods in real industries. Despite the recent advances in data-driven prognostics, two challenging
issues on RUL estimations are supposed to be noted.
(1) Determination of first predicting time (FPT)
While it is usually convenient for directly modeling the relationship between the collected data and the RUL values
in the run-to-failure training dataset, the exact machinery RUL at a certain time mostly cannot be considered a fixed label. In the early operating periods, the machine is in healthy state and no remarkable difference can be observed from the measured data. At some time, an incipient fault occurs and the machine starts to degrade. Therefore, it is essential to properly determine the first predicting time in order to accurately estimate the degradation level. In the literature, despite the wide application of data-driven methods on RUL prediction, the determination of FPT still mostly depends on conventional features such as kurtosis, and less attention has been paid on this issue.
(2) Data distribution discrepancy between entities
The success of data-driven methods mostly relies on the assumption that training and testing data are from the same distribution. However, in bearing RUL prediction problems, the training and testing data are collected from different entities. While the machinery operating conditions such as rotating speeds can be identical, the bearing faults are usually different with each other. Consequently, the degradation behaviors are not the same for different bearings, that results in significant data distribution discrepancies between entities. Therefore, it is difficult to generalize the learned prognostic knowledge from the training data to the testing data.
The effectiveness of the data-driven prognostic methods can be lar
剩余内容已隐藏,支付完成后下载完整资料
机械剩余使用寿命预测中的数据比对深度对抗神经网络
摘要
近年来,智能数据驱动的机械预测与健康管理以其精度高、响应快、易于实现等优点越来越受到人们的关注。虽然已经取得了令人满意的预后表现,但第一次预测剩余时间使用寿命一般难以确定,且数据分布不一致。不同的机器往往被忽视,这会导致预测的恶化。在本文中,一个针对这一问题,提出了基于深度学习的预测方法。生成性对抗网络用于学习机器健康状态下的数据分布,并生成健康指标建议确定首次预测时间。随后,进一步介绍了对抗训练实现不同机器实体的数据对齐,以提取广义预测模型知识。在两个旋转机械数据集上进行了剩余使用寿命预测实验实验结果验证了该方法的有效性。
1 简介
旋转机械的预测与健康管理在现代工业中非常重要。机械可靠性高,降低维修成本,提高效率操作安全[1–6]。在过去的几年里,PHM受到越来越多的研究兴趣,特别是在先进的智能制造、航空航天等产业。PHM是旋转机械的关键部件之一。滚动轴承(REB)的设计已得到广泛的研究。一般来说,机械状态监测收集振动信号等数据,以评估设施退化水平和剩余使用寿命(RUL)在预测设备故障之前[6–10]。按照惯例,轴承的RUL可以根据美国轴承制造商协会(ABMA)标准然而,由于旋转机械传统的方法越来越复杂在RUL预测方面效率较低,而且准确可靠预测方法在现实生活中一直受到高度的要求 [12-14]。
在文献中,现有的方法对滚动轴承RUL估计通常分为两组,即基于模型的[15,16] 以及数据驱动方法[17]。基于模型的方法是基于物理定律和数学函数描述系统的退化行为[13,18]。尽管基于模型的方法在以下情况下的有效性:
系统健康状态得到了很好的表示[19],物理模型通常很难开发,特别是对于
复杂的机器[20]。另一方面,数据驱动方法主要是为了捕捉两者之间的直接关系
状态监测数据和机器退化状态人工智能。通常不需要什么专业知识,这有利于工业应用。在过去的几年里,数据驱动神经网络(NN)[21]等方法支持
向量机(SVM)[22],神经模糊系统[23]等,已经由于易于实施的巨大优点而得到了广泛的发展,快速反应和良好的预后表现。然而,需要指出的是,这项研究的主要局限性在于大多数数据驱动的预测方法依赖于内在数据附属国。基本上需要大量的训练数据对于大多数情况下的模型建立,以及质量收集的数据的准确性直接影响到患者的预后数据驱动方法。
目前,随着我国工业收入的大幅增长数据和计算硬件和算法的快速发展,
它的应用前景越来越广阔数据驱动的预测方法在实际工业中的应用。尽管
数据驱动预测的最新进展。关于RUL估计的问题应该注意
- 首次预测时间(FPT)的确定
而直接建模通常比较方便,收集的数据与RUL值之间的关系在运行到故障训练数据集中RUL在某一时刻大多不能被认为是固定的标签。在运行初期,机器处于健康状态,无显著性差异。根据实测数据。在某个时候,一个初期的错误发生时,机器开始降级。因此,它是对正确确定第一次预测时间至关重要以便准确估计退化程度。在尽管数据驱动技术的广泛应用预测RUL的方法,FPT的测定主要取决于峰度等常规特征,而在这一问题上,人们的关注较少
- 实体间数据分布差异
数据驱动方法的成功主要依赖于假设训练和测试数据来自同一个地方分配。然而,在轴承RUL预测问题中,培训和测试数据是从不同的角度收集的实体。而机器的运行条件由于转速可以相同,轴承故障是通常彼此不同。因此,退化不同方位的行为不一样,这导致了数据分布的显著差异实体之间。因此,很难一概而论
从训练数据中学习到预后知识测试数据。
数据驱动的预测方法的有效性可以在很大程度上受这两个具有挑战性的问题的影响。在近年来,深度学习已经成为一种高效的学习方式数据处理技术,并取得了很大的成功在许多数据驱动的任务[24]中,例如图像处理,语音识别等深度神经网络的有效性高维机械数据的特征提取。在最新的研究中,预后任务已经得到了验证[25]。因此,深度学习有可能克服并取得了较好的RUL预测结果。
提出了一种基于深度学习的数据驱动预测方法旋转机械试验方法。生成性对抗性神经系统网络被用来学习数据在网络中的分布机器的健康状态,是系统的有效指标异常可以建立,这决定了预测的第一步预测时间。进一步采用学习的特征对于剩余使用寿命的估计,对抗性训练是必要的还介绍了不同实体的数据对齐。在这个通过这种方法,可以提取实体不变的特征,并对数据进行分布差异可以在学习的子空间中桥接,提高了数据驱动预测模型的泛化能力方法。
在这项研究中,实验在两个旋转机械数据集进行验证。这是从数值模拟的角度观察到的结果表明,该方法具有较好的数据比对性能关于预测问题的现有方法。这个在不同的情况下可以很好地确定首次预测时间,得到了较小的RUL估计误差。结果表明所提出的方法提供了一种新的和有前途的工具真实世界预后案例研究中的RUL预测。
本文的剩余部分从相关工作开始在第二节。准备工作在第3节中介绍。这个
提出的方法在第4节中介绍,并进行了实验验证已在第5节中验证。我们在文章结尾给出了结论剖面图。
2相关工程
在过去的几年中,智能数据驱动的预测方法得到了广泛的发展,并取得了良好的效果获得[9,26–28]。由于便于收集,在实际工业中,机械振动数据得到了广泛的应用用于预测。在文献中,有相当多的努力对有效信息特征的提取进行了研究。
根据原始测得的振动数据[28,29]。按照惯例,时域和频域特征,如峰值,采用了峰度、均方根等[13]。在[30]中,Lei等人总结了24种广泛应用的时域和频域方法信号处理功能。Wu等人[31]利用了多种预测的退化特征,如统计特征,固有能量特征和故障频率特征。混血儿Wang等人[32]提出了预测模型,其中振动数据的最大振幅用于RUL估计。随着旋转机械越来越复杂,传统的手工选择的功能已经不那么强大了有效描述系统退化行为[33]。因此,本文旨在提取更具代表性的特征根据振动数据进行预测。端到端的建立预测框架,直接取采集到的原始数据数据作为输入。很少有信号处理方面的专业知识预测是必需的,这有助于实际应用行业。
神经网络作为最流行的数据处理技术之一网络已经被广泛地应用于预测中,并且前景广阔得到了RUL的预测性能。竞争对手提出了一种基于学习的机械设备长期预测方法由Malhi等人提出[34]。递归神经网络该方法用于振动数据的特征提取。高效的提出了一种机器健康状态估计方法Pan等人[35],其中在线动态模糊神经网络使用,轴承健康状况得到有效预测。作为Yuan等人[36]利用了传统RNN的有效变体一种基于长短时记忆(LSTM)的神经网络结构对于航空发动机的RUL预测,如果比较复杂考虑了操作、显著噪声和混合故障。
此外,深度神经网络又称为深度学习在数据驱动的预测中受到越来越多的关注。多个隐藏层堆叠在网络架构中提高学习能力,正规化为了提高系统的泛化能力,采用了多种技术模型[37,38]。可以提取更好的高级表示从原始输入数据,这有助于进一步RUL预测。Li等人[39]提出了一种深度卷积神经网络模型
基于网络的预测RUL估计方法。这个对航空发动机运行中的健康状况进行了评价。一种多方位RUL的集成深度学习方法Ren等人[40]提出了预测,其中并利用了频域特征。为了建造作为轴承的健康指标,郭等人[41]开发了一个卷积的
考虑趋势毛刺的神经网络。在[42]中采用递归神经网络对轧制速度进行了估计
元件轴承。一种基于小波变换的多尺度特征提取方法[43]提出了深卷积神经网络,其中使用该方法可以获得很好的轴承RUL预测性能从振动数据中学习特征。
而以深度学习为基础的预测方法在文学上成功地发展了两个具有挑战性的问题。如引言部分所述,我们收到了更少的关注。首次预报时间的确定在数据驱动的环境中,退化问题没有得到有效的解决框架之间的数据分布差异对实体的考虑较少。
近年来,为了提高系统的泛化能力在数据驱动模型的基础上,对故障诊断中的一些相关工作进行了研究对图像进行不变特征提取不同的机械操作条件[44]。最小化训练和测试之间的最大平均差异(MMD)数据显示,在提取共享数据方面有很好的性能不同实体的特征[45,46]。轴承数据的MMD在不同的工作场景中,Lu等人[47]将其最小化,模型的泛化能力显著提高。锂等人[48]提出了一个基于深层生成网络的模型跨域诊断任务,以及实、实之间的MMD
创建的数据也被最小化。
作为另一种方法,对抗性训练提取器和鉴别器最近被引入到利用神经网络,可以有效地对不同实体的数据进行分类投射到学习子空间中的相同区域。
这样,从培训实体学到的知识可以很好地推广到测试类。深卷网络是郭等人[49]提出的用于诊断的,其中特征提取器获得广义特征不能用鉴别器来区分。在本文中有前途的对抗式神经网络用于预测。通过多个模块之间的对抗性训练可以根据所学的健康状况来确定预测时间指标,并可提取实体不变特征同时也保证了算法的泛化能力预测模型。
3预备工作
3.1. 问题表述
本文研究了数据驱动的滚动预测问题研究了单元轴承。假设runto失败Mtrain轴承的振动数据可用于模特训练。具体来说,假设承载实体在工作初期身体健康。一段时间后他们开始退化。数据样本来自采集的序列振动数据,每个样本包含D输入数据点.让{x j i } n j i=1 isin; R Dinput , j = 1, 2, . . . , Mtrain表示训练中属于第j个承载实体的第i个样本数据集,其中n是的连续样本数jth轴承。
本研究旨在首先了解健康指标函数,h = fHI(x)。以样本x作为输入。输出h能够明确指出机械健康状况的变化,并且可以确定降解的第一预测时间基于预定义的阈值
让TjFPT表示设备的FPT第j轴承。
接下来,由于可以获得训练实体的fpt,每个轴承的运行到故障数据可以分为健康状态和退化状态。剩余使用年限降解期间的百分比可计算为
其中yij代表jth轴承的第一个时间步长上xij的RUL标记。
这样,所有的训练样本都处于退化状态可以贴上相应的标签,并监督RUL可以得到估计训练数据集。此外,无监督的测试数据也可以用来增强模型泛化能力。而测试数据一般应无监督数据通常被认为是不可观测的易于收集,特别是在早期运营期轴承处于健康状态。无监督公司的合并数据有助于提高模型的泛化能力,可以获得更好的预后表现。应该的需要指出的是,只有有限数量的无监督数据对于所提出的方法来说是足够的,它提供了额外的绩效改进。所提出的方法仍然是可行的在没有无监督测试数据的情况下应用。通过对有监督训练数据和无监督训练数据的探索测试数据,本文的主要目的是建立RUL预测模型ycirc;=fRUL(x),其中ycirc;是输入数据样本x的预测RUL值。应为注意,x代表设备的状态监测数据系统,如振动信号,电流数据,声发射等。ycirc;是一个与时间相关的一般估计RUL值,其单位为可以在特定的应用场景中正确确定,例如天、小时、分钟等。
3.2. 对抗性神经网络
本文介绍了对抗式神经网络方案发展预测模型,这是第一次用于生成性对抗网络(GAN)[50]。甘的目标从随机噪声中产生真实的数据样本,并将发生器模块G用于将噪声z映射到样本x、 为了评估生成的数据G(z)的质量,采用鉴频模块D,对其进行了优化区分真假样品。但是,参数对生成器的属性进行更新以欺骗鉴别器,即生成鉴别器无法分辨的样本。通过两个模块之间的对抗性训练生成器逐渐学习底层映射函数G在噪声和真实样本之间。网络优化可以公式为[50],最小克最大值D级
Exsim;pdata(x)[logD(x)] Ezsim;pz(z)[log(1minus;D(G(z)))],(2)
其中pdata和pz表示实际
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[605733],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。