相关流形距离在转子故障数据集分类中的应用方法
发布时间:2019-12-06 14:56
【摘要】:针对故障特征属性值域之间存在着一定相关性导致准确分类困难的问题,提出一种能够考虑相关系数影响作用的转子故障数据集分类方法;该方法是将相关流形距离的边界Fisher分析(Correlation Manifold Distance Marginal Fisher Analysis,CDMFA)与相关流形距离的K-近邻(Correlation Manifold Distance K-Nearest Neighbor,CDKNN)分类器概念相结合在一起的结果。首先,将振动信号集合转换成多域、多通道高维故障特征数据集;然后,通过CDMFA将融合相关系数的相关流形距离用于度量数据样本间的近邻与权值,据此能更好地反映高维数据间的相似性关系,提取出能使类间距离趋大的低维特征子集;最后,将得到的低维特征子集输入到CDKNN分类器中进行故障模式辨识。用一个双跨度转子系统数据集与仿真数据集对所提出的方法进行了验证。结果表明:本方法降维效果良好,可获得更高的故障分类准确率。研究发现,采用相关流形距离作为信息测度的故障数据分类方法能更真实地揭示出高维特征间的几何结构关系;该方法可为高维故障数据集的特征属性约简与分类,提供降低数据规模的理论参考依据。
【图文】:
rs序号特征参数序号特征参数序号特征参数1均值7偏斜度13均值频率2方根幅值8峰值指标14峭度频率3均方幅值9波形指标4平均幅值10斜度指标153层小波包分5峭度11频率中心~解频带能量6偏斜度16峭度指标22特征注:1~10为时域特征;11~14为频域特征;15~22为时频域小波包分解的能量特征3.3设计的故障数据分类方法流程本文提出的故障分类方法流程,如图1所示。具体实现过程主要以下几个步骤:步骤1将原始振动信号转化为多域、多通道的高维故障特征数据集X,并将其分为训练样本集X1与测试样本集X2两部分。图1CDMFA与CDKNN相结合的故障分类方法流程图Fig.1TheflowcharofthefaultclassificationmethodofCDMFAcombinedwithCDKNN步骤2将X1输入CDMFA进行训练,得到映射矩阵A,再利用A对X1、X2进行维数约简,得到d(1≤d<n)低维特征矢量Y1、Y2。步骤3利用CDKNN分类器进行故障模式辨识。将低维特征矢量Y1、Y2输入CDKNN中,利用训练样本的邻域和类别标签信息,辨识出测试样本的故障模式。4实验结果与分析为验证本文方法的有效性,选取UCI数据库中的Iris仿真数据集[12]与转子故障模拟实验数据进行验证。其中,用转子故障模拟实验信号集合构造的原始高维故障数据集,其特征属性元素的构成情况见表1。4.1Iris仿真数据实验Iris数据集以鸢尾花的特征作为数据来源,数据集包含150个样本,分为3类,每类由50个样本组成,每个样本包含4个独立的属性特征,是机器学习、数据挖掘、数据分类中常用的测试集与训练集。本文设置每类前20个样本为训练样本,后30个样本为测试样本集。为验证CDMFA相对于MFA维数约简方法的有效性,将仿真数据集经PCA、MFA、CDMFA降维,目标维数为2=3-1,图2中:(a)、(
如表2所示。图2仿真数据特征分布图Fig.2Featuresmapofsimulationdata表2各降维方法的识别准确率Tab.2Methodsofdimensionreductionofrecognitionaccuracy%分类器不同约简方法下平均识别准确率(d=2)原始LDAMFACDMFASVM86.589.391.293.5KNN90.591.194.596.4CDKNN92.293.395.697.5结合图2与表2可知,CDMFA算法相对于MFA改进后性能有明显的提升;CDKNN分类器相对于KNN较稳定且能够获得更高的识别精度,说明新的测度对近邻样本赋予不同权重,使得测试样本的辨识精度更高。4.2转子故障模拟试验本实验研究对象为参考文献[13]图3所示的双跨度转子试验台。在该试验台上进行升降速试验,模拟五种典型转动状态即:质量不平衡、转子不对中、轴承松动、动静碰磨以及正常。试验台在6个截面处相互垂直方位上分别布置了12个电涡流传感器,通过不同方位采集转子系统的振动信号,另在电机端安置第13个电涡流传感器用来拾取转速信号。在采样频率为5000Hz,转速为2800r/min的情况下,截取各状态50组样本,其中30组作为训练集、20组作测试集,通过截取多域特征参数,构建高维故障特征数据集。4.3转子故障数据集应用结果与分析为验证CDMFA的维数约简效果,选择PCA、LDA、LPP、MFA等降维方法与之作对比。其中,k1=5,k2=40,β=0.5,维数约简的目标维数参数选取参考文献[14],即目标维数=故障类别数-1=4。将构建的高维数据集输入到五种降维方法,得到测试样本前三个主元的低维嵌入效果,,如图3所示。图3测试样本基于不同降维方法的降维效果Fig.3Theresultsoftestsamplebasedondifferentmethodsofdimensionreduction由图3可知,前三个主分量在三维图描述下,PCA、LDA、LPP、MFA降维后的各状态都发生了一定量
本文编号:2570424
【图文】:
rs序号特征参数序号特征参数序号特征参数1均值7偏斜度13均值频率2方根幅值8峰值指标14峭度频率3均方幅值9波形指标4平均幅值10斜度指标153层小波包分5峭度11频率中心~解频带能量6偏斜度16峭度指标22特征注:1~10为时域特征;11~14为频域特征;15~22为时频域小波包分解的能量特征3.3设计的故障数据分类方法流程本文提出的故障分类方法流程,如图1所示。具体实现过程主要以下几个步骤:步骤1将原始振动信号转化为多域、多通道的高维故障特征数据集X,并将其分为训练样本集X1与测试样本集X2两部分。图1CDMFA与CDKNN相结合的故障分类方法流程图Fig.1TheflowcharofthefaultclassificationmethodofCDMFAcombinedwithCDKNN步骤2将X1输入CDMFA进行训练,得到映射矩阵A,再利用A对X1、X2进行维数约简,得到d(1≤d<n)低维特征矢量Y1、Y2。步骤3利用CDKNN分类器进行故障模式辨识。将低维特征矢量Y1、Y2输入CDKNN中,利用训练样本的邻域和类别标签信息,辨识出测试样本的故障模式。4实验结果与分析为验证本文方法的有效性,选取UCI数据库中的Iris仿真数据集[12]与转子故障模拟实验数据进行验证。其中,用转子故障模拟实验信号集合构造的原始高维故障数据集,其特征属性元素的构成情况见表1。4.1Iris仿真数据实验Iris数据集以鸢尾花的特征作为数据来源,数据集包含150个样本,分为3类,每类由50个样本组成,每个样本包含4个独立的属性特征,是机器学习、数据挖掘、数据分类中常用的测试集与训练集。本文设置每类前20个样本为训练样本,后30个样本为测试样本集。为验证CDMFA相对于MFA维数约简方法的有效性,将仿真数据集经PCA、MFA、CDMFA降维,目标维数为2=3-1,图2中:(a)、(
如表2所示。图2仿真数据特征分布图Fig.2Featuresmapofsimulationdata表2各降维方法的识别准确率Tab.2Methodsofdimensionreductionofrecognitionaccuracy%分类器不同约简方法下平均识别准确率(d=2)原始LDAMFACDMFASVM86.589.391.293.5KNN90.591.194.596.4CDKNN92.293.395.697.5结合图2与表2可知,CDMFA算法相对于MFA改进后性能有明显的提升;CDKNN分类器相对于KNN较稳定且能够获得更高的识别精度,说明新的测度对近邻样本赋予不同权重,使得测试样本的辨识精度更高。4.2转子故障模拟试验本实验研究对象为参考文献[13]图3所示的双跨度转子试验台。在该试验台上进行升降速试验,模拟五种典型转动状态即:质量不平衡、转子不对中、轴承松动、动静碰磨以及正常。试验台在6个截面处相互垂直方位上分别布置了12个电涡流传感器,通过不同方位采集转子系统的振动信号,另在电机端安置第13个电涡流传感器用来拾取转速信号。在采样频率为5000Hz,转速为2800r/min的情况下,截取各状态50组样本,其中30组作为训练集、20组作测试集,通过截取多域特征参数,构建高维故障特征数据集。4.3转子故障数据集应用结果与分析为验证CDMFA的维数约简效果,选择PCA、LDA、LPP、MFA等降维方法与之作对比。其中,k1=5,k2=40,β=0.5,维数约简的目标维数参数选取参考文献[14],即目标维数=故障类别数-1=4。将构建的高维数据集输入到五种降维方法,得到测试样本前三个主元的低维嵌入效果,,如图3所示。图3测试样本基于不同降维方法的降维效果Fig.3Theresultsoftestsamplebasedondifferentmethodsofdimensionreduction由图3可知,前三个主分量在三维图描述下,PCA、LDA、LPP、MFA降维后的各状态都发生了一定量
本文编号:2570424
本文链接:https://www.wllwen.com/jixiegongchenglunwen/2570424.html