基于DCFM模型的设备故障预测方法与流程

文档序号:26645687发布日期:2021-09-15 03:06
基于DCFM模型的设备故障预测方法与流程
基于dcfm模型的设备故障预测方法
技术领域
1.本发明涉及数据挖掘和机电故障预测领域,具体涉及一种基于dcfm模型的设备故障预测方法。


背景技术:

2.现有设备故障状态预测方法核心思路多数是基于信号处理或解析模型,在大规模的数据条件下这类模型不能够满足故障预测所需的实时性与准确性等;部分文献所公开的预测方案虽然涉及了机器学习,但是这些方案对设备的原始特征挖掘较为粗糙,仅使用原始特征进行训练难以达到满意的预测效果,且多数算法比较依赖人工设计特征。
3.lr(logistic regression)作为工业界常用的分类器,优势在于形式简单、具备较强的解释性、易于实现并行等,但是缺点是过于依赖特征工程,非线性学习能力弱。poly2模型在一阶特征的基础上考虑了二阶组合特征,但是计算复杂度较大,对于稀疏数据的交叉特征项的权重不能得到充分学习,影响模型的预测效果。谷歌的wide&deep模型联合训练wide部分和deep部分,然而该模型的wide部分也依赖特征工程。ffm(field

aware factorization machines)则是在fm模型的基础上引入了特征域,使模型学习更为精细,但是带来的问题是模型计算复杂度增大,影响模型学习效率。dnn模型有着对高阶特征探索的优势,但是dnn忽略了低阶特征所携带的重要信息,也会影响预测效果。


技术实现要素:

4.本发明提供的基于dcfm模型的设备故障预测方法,是通过搭建一种能够充分探索设备高低阶特征信息的网络结构,从而实现设备信息更深层次、更全面的提取,提高设备故障预测模型的分类效果,同时该模型对设备的特征进行自动叉乘,可以在一定程度上弥补传统机器学习方法依赖特征工程的劣势。另外,dcfm模型的fm模块基于隐向量可以实现对稀疏数据的二阶特征参数进行细腻学习;fm和cross network模块的学习效率均为线性级别复杂度,在一定程度上提高了模型的训练速度,有利于模型的快速构建,相比较其他复杂的机器学习以及深度学习模型,dcfm模型可以满足设备故障状态在线预测对时间响应及准确度方面的需求。
5.本发明的技术方案主要包括搭建dcfm网络模型并基于该模型实现设备故障预测。搭建dcfm网络模型主要包括如下步骤:
6.s1:加载设备样本数据并进行特征筛选。
7.通过特征选择中的嵌入方法进行特征筛选,嵌入方法使用xgboost算法中的特征重要度分析;特征j的全局重要度通过本身在单颗树中重要度的平均值来衡量:
[0008][0009]
特征j在单棵树的重要度主要是通过表示,计算以特征j分裂之后
损失的减少值,m是树的数量。
[0010]
s2:将筛选后保留的重要特征进行编码,并组成嵌入堆叠层作为dcfm模型的输入。
[0011]
设备特征包括连续性和离散型两种类型特征,对连续性特征进行归一化编码,对离散型特征进行嵌入编码,将两种编码特征拼接为嵌入堆叠层,统一模型输入。归一化公式如下:
[0012]
s3:设计嵌入了deep network、fm、cross network三种模块的自动构造设备特征模型,定义并行关系的deep network、fm、cross network三种模块用于设备特征的自动构造与探索,该模型同时能够实现设备特征自动叉乘,简化了手工构造特征的流程。
[0013]
s4:将设备特征输入至deep network模块中,对设备的隐式高阶特征信息进行提取。
[0014]
deep network隐藏层节点之间为全连接关系,隐层数目与隐层节点数通过超参数设定,计算单元采用relu进行激活;经过多层计算单元的非线性变换,使deep network能够探索到设备的隐式高阶特征信息,该步骤利用deep network对探索高阶特征信息的优势,来挖掘设备特征中所蕴含的更深层次的信息。
[0015]
s5:fm模块共享deep network模块的输入,用于二阶互异特征之间的交叉。
[0016]
fm模块用于二阶设备特征的构造和一阶二阶设备特征的表达,具体过程为:使用x
i
表示i维设备特征,x
i
x
j
表示第i维与第j维特征的交叉项,交叉特征对应的权重系数个数为n(n

1)/2个;在稀疏的数据场景下,同时满足交叉特征均不为0的情况稀少,这会导致特征交叉项对应的权重难以学习,因此引入辅助向量v
i
,v
j
,通过隐向量来有效解决稀疏的设备数据场景下权重系数难以学习的问题,也使fm对于低阶特征参数的学习更加细腻,同时优化模型学习效率。另一方面,fm模块能够使预测结果考虑一阶和二阶设备特征的作用,进而提升dcfm模型的通用性。
[0017]
s6:cross network模块共享deep network、fm模块的输入,用于显示高阶设备特征间的交叉组合。
[0018]
cross network模块是实现显示高阶特性构造的核心,被设计为高效的学习交叉特征参数,其数学表达式为:
[0019]
其中x
l+1
表示cross network模块的第l+1层输出,即第l+1层设备特征向量,x
l
表示cross network模块的第l层输出,即第l层设备特征向量;w
l
为所要学习的权重参数,b
l
为偏置项,x0表示0层设备特征输出,表示l层设备特征输出的转置,f(
·
)表示拟合该层输出和上一层输出的残差。将x
l
,x0设备特征向量做外积运算可以得到l+1阶设备特征的交叉组合,该模块特殊的网络结构能够穷举有限阶特征组合,避免了手工进行特征叉乘等繁琐流程,交叉特征阶数随着layer depth的增加而增加,且cross network模块为线性时间复杂度,有助于网络模型的快速搭建。
[0020]
s7:在融合输出层,融合三种模块所共同探索的设备信息,生成连接向量。
[0021]
融合输出层将deep network、cross network和fm三个模块的结果项进行融合,生成的连接向量蕴含了设备显式高低阶特征及隐式高阶特征信息,从而实现对设备状态更全面的探索。
[0022]
s8:将连接向量输入到概率预测函数,计算设备状态故障的概率,将sigmoid作为最外层概率预测函数,用来计算最终的故障概率结果。
[0023]
s9:定义阈值,计算设备故障状态的预测结果,阈值r为0.5,大于r则判定预测结果为1,否则为0。
[0024]
所述实现设备故障预测流程主要包括如下步骤:
[0025]
(1)按照统一的模型输入对设备数据进行编码处理。
[0026]
(2)将设备数据按4:1进行训练集和测试集的划分,训练集用于对dcfm模型进行拟合,测试集用来观察dcfm模型的拟合效果,模型评价指标为auc与logloss。
[0027]
(3)计算损失阶段,使用logloss作为模型的损失函数,用于计算输出值与目标值之间的误差。
[0028]
(4)使用adam对模型参数进行优化。
[0029]
(5)评价指标logloss值不再发生剧烈变化时或训练次数达到最大迭代次数上限时,输出训练好的模型文件。
[0030]
(6)加载保存的dcfm模型,将待预测的设备样本,输入到dcfm模型,得到设备故障分类的结果。
附图说明
[0031]
图1为本发明的整体流程图;
[0032]
图2为本发明中的dcfm模型结构图;
[0033]
图3

1、3

2为本发明中的dcfm模型训练结果图。
具体实施方式
[0034]
下面给出一个具体的实施例,结合实施例可以对本发明的技术方案和取得的效果获得更好的理解。
[0035]
实施例所用数据集来自实验团队在2018年实施智能设备项目,表1展示了设备原始数据集中的16维特征,为降低特征冗余对模型训练效率的影响,使用xgboost算法对原始设备特征进行筛选,保留了重要的10维特征,如表2所示,主要包括设备状态、功率、齿轮箱入口油温、齿轮箱油温、机舱温度、风速叶轮转速、偏航位置液压油温等。
[0036]
表1.设备故障原始特征
[0037]
[0038][0039]
表2.设备故障筛选后的特征与说明
[0040][0041]
表3展示了原始设备数据分布信息,处于正常运行状态的设备数据占有较大部分,使数据集中正常数据和故障数据存在一定的比例失衡,影响模型的学习。在“设备故障”变量的统计数据中,设备故障标注占27.9%,正常状态的标注占72.1%,设备的平均故障率约27.9%左右;本实例采用分层采样交叉切分对正常运行数据分层采样,保证训练集,测试集与原始数据集类别样本比例相同。
[0042]
表3.原始数据分布信息
[0043][0044]
(1)数据处理阶段,根据模型统一输入标准进行无量纲化编码与嵌入编码,组成嵌入堆叠层。
[0045]
(2)dcfm网络模型构建阶段,以嵌入堆叠层开始连接并行的deep network、cross network、fm模块,模块参数为deepctr提供的模块组件默认参数;用于实现对高低阶特征信息的提取和特征间的自动叉乘。
[0046]
(3)模型训练阶段,使用adam算法作为模型权重学习阶段的优化器,其中adam优化器使用β1=0.9,β2=0.999,ε=10
‑8作为初始参数,learning rate为0.001;将训练集输入到模型中进行训练。
[0047]
(4)故障预测阶段,将待预测的样本,输入到预测层,得到设备故障状态的结果。
[0048]
训练过程使用auc和logloss作为评价函数并通过可视化观察模型迭代效果;auc值为roc曲线所覆盖的区域面积,auc越大,表示分类器分类效果越好;logloss为交叉熵损失,用于计算输出值与目标值之间的误差;为直观展示模型效果,实验绘制了auc与logloss曲线用于观察模型的训练效果。图3

1显示auc指标的变化,在100轮迭代时,融合结构的性能已经超过了其他模型;图3

2显示,交叉熵损失随着epoch的增加不断减小,在100次迭代
以后趋于平稳,融合结构的logloss值与deepfm的logloss值持平。
[0049]
为了验证本发明的有效性,在云南真实设备场数据集上进行对比:实验对比训练了lr、fm、deepfm、dcn、dnn五种不同类型模型,并将五种模型的评价指标记录在表4中。从表4可以看出,lr算法的auc为0.8744,该算法仅使用了一阶设备特征进行分类,却达到了较好的分类效果。fm模型在一阶设备特征的基础上添加了设备二阶特征的权重,使fm模型的auc提升了0.0016,这说明二阶设备特征对分类效果的提升具有积极作用。dnn模型则通过对隐式高阶设备特征的探索,最终在性能上远远超过了lr和fm模型,这也验证了高阶设备特征对故障预测结果的影响。deepfm与dcn模型由于都考虑了高阶设备特征的作用,因此两类模型的性能优良。观察dcfm模型的两项指标可以发现,该模型性能优于其他单一结构和浅层模型,甚至超过了deepfm与dcn网络,这是由于cross network虽然对显式高阶交叉特征参数的学习更为充分,但是对低阶特征参数的学习却较为粗糙,而fm模块基于隐向量则可以很好的对低阶特征进行学习补充,因此dnn、cross network模块在融合了fm的低阶特征后,使模型对特征的提取更为全面充分。最后在融合输出层同时融合了fm、dnn、cross network提取的设备状态信息,使得模型的分类性能得到进一步提升,也验证了该模型在设备状态预测方向的有效性。
[0050]
表4.多模型的性能评估
[0051][0052]
本发明是一个泛化性极强的通用型结构,对于不同的核心设备部件均适用,且拥有良好的预测性能;同时,模型的运算能保持在线性时间复杂度级别,保证了模型在实际的设备状态预测场景中的可行性。
再多了解一些
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1