基于参数模型的机车子系统异常检测外文翻译资料

 2022-07-26 16:03:47

英语原文共 6 页,剩余内容已隐藏,支付完成后下载完整资料


基于参数模型的机车子系统异常检测

Feng Xuelowast;, Member IEEE and Weizhong Yanlowast; Member IEEE

.244-1380-X/07/$25.00 copy;2007 IEEE

摘要-机车是复杂的机电系统。不断监测机车的健康状况在现代成本效益的维护策略中至关重要。典型的机车具有根据控制系统中的逻辑规则产生故障信息或事故的能力。同时,还收集传感器读数和操作状态变量。目标是早期检测故障,根据收集的故障日志和参数数据提供维护操作和行程规划的提前期。本文提出了一种基于模型的异常检测策略。在该方法中,使用基于正常运行数据的神经网络模型对机车子系统的输入输出关系进行建模。计算测量值和模型输出之间的残差。基于这些多个残差的推理模块用于在每个时刻产生子系统的总体健康指标,进一步用于确定子系统是否异常。统计检验,高斯混合模型和支持向量机用于生成这个健康指标,并比较其表现。我们使用机车的现实操作数据来证明异常检测策略的有效性。

一、引言

基于状态的维护已经被证明是控制工程系统服务成本的有效方法,同时保持其理想的运行可靠性。在过去十年中,设备制造商已将业务重心迅速转移到以服务为导向的业务,以此作为增加基础产品销售收入的一种方式。因此,控制系统建立在机器上以优化其运行。这种控制系统还提供了评估设备健康的有价值的信息,这导致设备的维护成本更高。

有效的基于条件的维护策略需要几个关键技术,包括异常检测,故障隔离和诊断以及预后。异常检测重点是根据从资产收集的操作数据检测异常行为。故障隔离和诊断意图找出哪个子系统或组件有故障,以及故障有多糟糕。作为进一步的步骤,可能是最困难的一个,预后是提供子系统或组件的剩余使用寿命(RUL)估计。决策者(例如资产经理)可以根据他们可以获得的信息水平做出相应的决策。目标是尽早提供信息,以便在没有操作中断的情况下执行适当的操作。这些行为可以引导注意异常资产,早期订购部分,主动维护等。在这种预测与健康管理框架下,异常检测是第一步,为后续功能提供触发。

关于异常检测(也称为新奇检测)的文献中已经提出了许多技术。综合调查可以在[1] [2]中找到。在现实应用中,动态操作对执行精确的异常检测总是构成很大的挑战。

动态系统中,系统模型通常可以提供与系统的不同测量相关联的变化的良好解释。实际上,在基于模型的异常检测和诊断的文献中有很大的努力[3]。大多数基于模型的方法都依赖于基于物理的动态模型。然而,这种基于物理的模型并不总是可用,或开发成本太高。另外在远程监控和诊断中,以高频(例如1Hz)收集操作数据通常是非常昂贵的。通常,只有一段时间或周期性可用的系统操作数据的快照。在这种情况下,数据驱动的建模可能是另一种选择。无监督方法也被应用于异常检测[4] [5]。

操作数据的一个特征是操作条件的变化(例如速度,马力和环境条件)导致感官参数变化。这种操作条件引起的测量变化掩盖了由系统健康状况引起的变化。因此,任何直接用于原始传感器测量的异常检测方法被认为是不成功的。为了解决这个问题,本文采用基于模型的异常检测方案。在该方案中,首先构建数据驱动模型,以在健康条件下捕获基础系统行为。计算模型输出和传感器测量值之间的残差。然后,我们根据剩余部分制定不同的决策模块,对子系统的健康状况做出决定。

在本文中,我们将展示我们对运行数据用于机车故障检测的初步工作。特别是,我们专注于监测机车中涡轮增压子系统的健康状况。本文的其余部分组织如下:第二部分提供了关于这项工作的一些背景信息; 第三节描述了基于模型的方法和不同的推理方法; 第四节是机车涡轮增压系统的实验结果; 第五节是结论。

二、背景

随着更便宜的电信和计算能力的飞速发展,许多企业已经走向商业模式,远程捕获机器数据并主动诊断故障。持续监测机器或设备的健康状况是现代性价比高的维护策略的关键部分。这种方法具有成本优势,因为它可以更及时地应对昂贵的即将发生的故障,并允许将诊断知识保留并持续改进公司数据库。

GE运输系统自1999年以来一直在机车上进行远程诊断。车外诊断系统的一个主要组成部分是基于案例的推理(CBR)软件应用程序[6],帮助最终用户构建诊断策略发送 到现场的技术人员解决机车故障。由于控制器故障和其他异常情况发生在机车上,它们被收集并下载到中央监控中心进行分析。工程师将检查此数据和多个基于人工智能(AI)的诊断工具的输出,以确定设备是否遇到问题。如果诊断出问题,则会创建故障排除策略并将其发送给现场工程师,以便对机车进行维护。

图1.典型故障日志的示例和瞬时快照操作数据的捕获

每当生成故障日志时,也捕获机车的操作参数的快照。图1显示了一些典型的输出(每行是一个快照)。故障日志的每个记录由两个不同的信息组成。第一种是在机车上满足预定条件的情况下触发的故障代码; 而剩余的是机车的几个显着的运行参数的瞬时读数,尽管这些参数的实际值在图1中被掩蔽。

大多数努力集中在使用参数数据的故障代码分析。在本文中,我们重点研究参数分析,进一步增强初期故障的检测。

  1. 建议的异常检测方案
  2. 总体结构

在本文中,我们提出了一种基于模型的机车子系统异常检测方法。基于从机车收集的正常运行数据,离线训练神经网络模型,代表正常运行的子系统的输入输出映射。在线推理模式中,从机车收集运行数据,并将子系统的输入传递给训练模型,并计算测量输出与模型输出之间的偏差。推理者使用这些残差作出决定。

图2说明了我们提出的异常检测方案的总体结构。它由两个基本组成部分组成,即基础系统建模和基于剩余的决策。 这两个组件的细节如下。

图2.基于高级框架模型的异常检测

  1. 基础系统建模

对于给定的机车子系统,我们可以创建一个模型来表示基础系统行为。在许多情况下,这些模型表示系统的输入 - 输出映射。该方法的主要原理是识别系统行为与其模型的偏差。 与其模型的大偏差将表示异常行为。在我们的例子中,我们使用神经网络对系统行为进行建模。

神经网络模型的这种训练需要向训练算法呈现多个输入 - 输出数据向量元组的不同集合。每个模型的训练数据都是从正常运行数据集的集合中获得的。对于任何真实世界的应用程序,数据集的纯度总是一个问题。在GE运输远程监控和诊断中心已经有了一个很好的过程,我们需要经过一系列的过滤和清洗流程来创建正常的操作数据集。如上所述,我们部署了一个分裂征服的方法来开发每个子系统的模型,并一个关注一个子系统。对于特定的子系统,可以存在基于一组输入变量(X)的多个因变量(Ys)。在这种情况下,训练多个神经网络模型,每个因变量一个(如图3所示)。

图 3.子系统健康模型的训练

C.残余决策

一旦我们有一个系统模型,我们可以将该模型应用于从系统收集的操作数据。 可以计算与系统的每个Y的模型输出的偏差。然后将决策模块应用于残差,以预测系统的健康状况。为了进行强大的异常检测,我们采用多种方法进行检测。希望这些多重方法相互补充,并且这些多重输出的融合可以潜在地改善最终结果。

我们提出的这个决策模块的方法也是基于模型的。这个想法是对正常运行的残差进行建模。在测试模式下,将新的残差与这种正态模型进行比较,并根据异常程度做出决策。引入三种不同的方法来实现决策模块。它们是马氏距离(MD),高斯混合模型(GMM)和一类支持向量机(ocSVM)。这些决策模型用于获得异常指数。

我们可以根据残差应用不同的方法做出决策。不同的方法可能会在不同的情况下产生错误。融合多个模型的输出在机器学习社区中一直是提高推理器性能的重要研究课题。组合多个模型的想法是利用其互补的预测特征。因此,我们需要多种不同的模型来融合它们并获得更好的性能。

  1. 马哈拉诺比斯距离

在某种程度上,我们可以假定从正常操作获得的残差的多元正态分布。我们可以从训练数据集中估计平均和协方差矩阵。在在线过程中,在根据训练有素的神经网络模型的偏差得到新的运行数据记录的残差后,可以进行Hotelling T平方检验。 以类似的方式,可以计算马哈拉诺比斯距离,并施加阈值以拾取异常。 让Dt成为生成神经网络模型的训练数据集; Rt为Dt的Y残差。然后,我们可以导出平均mu;t(一个行向量)和方差矩阵Sigma;t。对于新的数据记录,我们可以计算剩余行向量r,并且Mahalanobis距离可以是:

大于阈值t的距离表示异常。该阈值可以根据训练数据集的误报率进行调整。

2)高斯混合模型

尽管在许多情况下,尽管正态分布可能是残差的有效模型假设,但在其他情况下,这种假设可能是关闭的。为了做一个一般的方法,我们应用高斯混合模型(GMM)[7]来模拟多变量残差向量的底层分布。GMM是包含多个高斯分量函数的密度估计模型。这种密度估计提供了基本人口统计学的平滑估计,具有很大的灵活性。以这种方式,残差由密度函数表示

每个数据记录的似然值可以在在线决策模块中计算,而小值表示异常。图5提供了GMM的图形说明,其中峰表示多个高斯分量。

图 5.模拟多变量分布的GMM的说明性例子

3)一级SVM

支持向量机(SVM)是最近发展起来的学习系统,起源于统计学习理论。SVM与其他学习系统的区别在于其决策面是高维特征空间中的最优超平面。此外,通过求解具有优化理论的正确形成的凸二次问题,可以找到最优超平面(具有最大边界的超平面),这在数学规划领域得到了很好的研究,可以以相对简单的方式解决。最大化分离边界可以调节模型的复杂性。因此,从统计学习理论的角度来看,SVM是结构风险最小化(SRM)方法的近似实现,为分类提供了良好的泛化性能。

Scholkopf等人[8]首先介绍的一类SVM与传统SVM不同之处在于如何训练SVM。 与传统的支持向量机(SVM)不同,正常和负面情况都是需要的,一类SVM只使用一类数据,并尝试估计包围数据集的最小超球体。以类似的方式,训练有素的一类SVM可以在在线推理模式中为测量提供异常指数。

  1. 实验结果

在本节中,我们将所提出的方法应用于机车涡轮增压系统。

A.问题和数据集

在异常检测的实践中,需要定期回答以下问题:哪个资产正在执行异常。在GE运输的RM&D中心的情况下,中心以各种不同的方式接收机车故障日志。一个常见的特征是,由于每当生成车载事件时收集数据,操作数据不会以固定的采样率进行采集。一旦调用异常检测模块,我们需要根据给定机车在一段时间内收集的运行数据提供决策。这样一段时间内的操作数据的集合被称为一个案例。在我们的研究中,我们在一个时间点收集了156例,其中涡轮相关故障5例,涡轮增压系统151例。一些正常情况被删除,因为它们的点数太少,因为我们上面提到的非固定采样率问题。因此,我们共研究了143例正常病例。我们使用100例正常情况来训练我们的模型,其余的用于验证假阳性率。我们的目标是尽可能减少我们的假阳性率,同时能够检测到5个异常病例。

图 6.健康案例涡轮增压系统的标准化参数(左)和故障案例(右)

B.涡轮模型

涡轮增压系统是机车发动机的一部分,为发动机提供高压空气入口以进行有效的燃烧。对于系统控制和健康监测目的,典型的发动机涡轮安装了十几种不同的传感器。这些传感器测量涡轮增压系统各个位置的速度,不同的温度和压力。我们将这些传感器测量值指定为s1,p1,p2,temp1,pres1,p2,temp2,(s为速度,压力为t,温度为t,p为其他参数),s2,temp3, temp4和pres2。从涡轮的物理学,我们知道这些传感器读数不是独立的。其实有些与其他人高度相关。我们假设在任何给定时间的传感器读数之间的这种相关关系是固定的,只要底层系统不变。给定在正常操作期间收集的足够的传感器读数,我们应该能够对传感器传感器关系建模,并随时间监视关系。任何时候在操作中,如果这种模拟关系被违反,我们说底层系统偏离正常运行,因此我们宣布异常发生。在本文中,我们使用神经网络模型来表示传感器读数之间的关系。具体来说,我们使用神经网络来模拟传感器s2,temp3,temp4和pres2与传感器s1,p1,p2,temp1,pres1,p2,temp2之间的功能关系。为了方便起见,我们称之为独立传感器,后来称为从属传感器。为了提高模型精度,我们使用4个单独的NN模型,每个NN模型表示一个独立传感器和所有依赖传感器之间的关系函数。

这里我们使用具有两个隐藏层的前馈神经网络。激活函数是双曲正切S形函数传递函数(tansig函数)和LevenbergMarquardt优化贝叶斯正则化用于训练。 以这种方式,网络尝试最小化平方误差和权重的组合,以便产生一般概括的网络。

从典型的正常情况和故障情况的时间序列图绘制在图6中。我们看到正常情况和故障情况下参数的显着变化。我们注意到,在一段时间内,故障情况下的temp3和temp4都稍微高一点,问题是这些是否可以显示涡轮故障。一旦我们将经过训练的涡轮增压模型应用于正常情况和故障,则判别功率显着增加,如图7和8所示。涡轮模型基于输入的变化来解释输出的大部分变化。

C.推理结果比较

然后,我们可以应用三种剩余推理方法来确定所有43个真正正常情况和5个真实故障情况下涡轮增压系统的健康状况。三个推理方法的结果总结如下。

MD,GMM和ocSVM的输出是单变量时间序列异常指数。需要对这个时间序列进行后期处理,以便对案件作出最后决定。对于MD为ocSVM方法,我们构成了索引时间序列的简单阈值,并计算了一个案例中异常点的百分比。超过25%表示案件的旗帜。

图7.对于典型的正常情况下涡轮增压系统的归

全文共8369字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[144588],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。