基于主动学习和半监督学习的工业故障分类研究及应用
本文关键词: 故障识别 主动学习 半监督学习 小样本不平衡数据分类 决策融合 出处:《浙江大学》2017年硕士论文 论文类型:学位论文
【摘要】:过程监测技术作为过程系统工程中的重要组成部分,在保障复杂工业过程的稳定性和可靠性,提高企业产品质量等关键问题上具有重要的理论意义和实践意义。得益于集散控制系统(DCS)的不断发展和广泛应用,海量的工业数据得以保存,因此,基于数据驱动的工业故障诊断技术在学术界和工业界都得到了普遍关注。然而,将传统的模式识别方法应用到工业故障诊断上时忽略了流程工业过程中采集到的数据特点,包括有标签故障样本少、正常数据与故障数据以及不同类型的故障数据之间往往存在样本量不平衡的问题,因此不能在数据集上训练出高精度的分类模型来对故障进行有效识别。本文在已有的经典分类算法上,提出了基于不平衡小样本的故障分类技术,将主动学习和半监督学习的思想与传统的基于模式识别的故障分类方法结合起来,并加入了对不平衡数据的代价敏感学习和重采样处理。主要研究工作和成果包括以下几个方面:1)针对流程工业过程中有标签故障样本少、样本标注代价昂贵、样本集存在类不平衡以及样本孤点问题,首先提出了一种改进的主动学习结合加权支持向量机的工业故障分类算法。通过综合考虑样本的信息度和代表性以及样本中可能存在的孤立点,将改进的主动学习算法用于挖掘那些对当前分类模型最有价值的样本并提交给专家进行标注。在进行主动学习算法的研究时,提出了一种改进的加权支持向量机作为基分类模型。对于训练数据中的不同样本,根据其重要性采用不同的权重系数,同时充分考虑了样本点在特征空间分布情况对于主动学习和分类精度的影响,提出了一种新的惩罚系数选取方法,对不同类别的样本赋予不同的惩罚因子,从而有效避免了主动学习过程中采集到重复、无意义样本的问题,并提高了分类准确率。实验结果验证了所提出的的算法能够在获得较高分类精度的条件下有效减少标注负担。2)在主动学习的基础上,针对标注代价昂贵的问题,提出了将半监督学习的思想用于故障分类中,从而通过机器的自动迭代训练来提高故障诊断的精度,减少人工标注耗费的时间和精力。针对半监督训练中容易出现的伪标记有误问题,提出了将一种改进的基于多分类器贝叶斯决策融合的分类算法用于无标签样本的标签标注上,并分析了噪声数据的PAC可学习性以及训练集更新的充分条件,同时加入了基于最近邻规则的噪音数据剪辑方法和针对不平衡样本的SMOTE重采样技术,从而使得新样本的纯净度得到了有效的保证。实验证明,提出的半监督学习算法具有较高的分类精度和稳定性。3)针对主动学习和半监督学习两种算法本身的特性及其存在的互补性,研究了如何将这两种算法进行有效的结合来更大程度地提高分类性能。传统的主动学习方法,在选择了最具有信息量的未标记样本进行标记并用于模型更新后,不再继续利用剩余的大量未标记样本。而在有标签的训练样本非常稀少的情况下,分类结果不确定性最大的无标签样本很难通过半监督学习获得正确的标签,使得迭代过程中容易出现较为严重的错误自累积。因此,提出了一种集成主动学习和半监督学习的故障分类方法,将少量的主动学习和半监督学习结合,最大程度地改善诊断模型的性能。实验结果证明了所提出算法的有效性和优越性,具有较高的应用价值。
[Abstract]:......
【学位授予单位】:浙江大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP277
【相似文献】
相关期刊论文 前10条
1 刘蓉;李红艳;;半监督学习研究与应用[J];软件导刊;2010年08期
2 陈武锦;;半监督学习研究综述[J];电脑知识与技术;2011年16期
3 梁吉业;高嘉伟;常瑜;;半监督学习研究进展[J];山西大学学报(自然科学版);2009年04期
4 唐晓亮;韩敏;;一种基于极端学习机的半监督学习方法[J];大连理工大学学报;2010年05期
5 李欢;;半监督学习及其在数据挖掘中的应用[J];电脑知识与技术;2010年27期
6 崔鹏;;一种用于半监督学习的核优化设计[J];软件工程师;2013年09期
7 王艳华;杨志豪;李彦鹏;唐利娟;林鸿飞;;基于监督学习和半监督学习的蛋白质关系抽取[J];江西师范大学学报(自然科学版);2013年04期
8 梅松青;;基于自适应图的半监督学习方法[J];计算机系统应用;2014年02期
9 李燕萍;唐振民;丁辉;张燕;;半监督学习机制下的说话人辨认算法[J];计算机工程;2009年14期
10 王劲松;陈哲;冯静兰;顾明亮;;半监督学习对十个口述数字的识别[J];电声技术;2010年04期
相关会议论文 前10条
1 柳斌;李之棠;涂浩;;基于半监督学习的应用流分类方法[A];2010年全国开放式分布与并行计算机学术会议论文集[C];2010年
2 葛荐;马廷淮;;基于集成算法的半监督学习研究[A];第29届中国数据库学术会议论文集(B辑)(NDBC2012)[C];2012年
3 赵玲玲;周水生;王雪岩;;基于集成算法的半监督学习[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
4 谷方明;刘大有;王新颖;;基于半监督学习的加权支持向量域数据描述方法[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
5 冯瑞;宋春林;;一种基于局部学习的复杂系统建模方法[A];2007中国控制与决策学术年会论文集[C];2007年
6 陈耀东;王挺;陈火旺;;半监督学习和主动学习相结合的浅层语义分析[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 邱慧宁;黄剑;陈羽;赖剑煌;;基于UDP的半监督学习及其在人脸识别的应用[A];第十四届全国图象图形学学术会议论文集[C];2008年
8 杨源;马云龙;林鸿飞;;基于权重标准化SimRank与半监督学习的产品属性归类[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
9 王倩影;冯国灿;汤鑫;;δ-距离及其在半监督增强中的应用[A];第十五届全国图象图形学学术会议论文集[C];2010年
10 林良宪;利德江;蔡孟璇;邱政贤;;针对小样本分类的半监督式学习法[A];第25届全国灰色系统会议论文集[C];2014年
相关博士学位论文 前10条
1 谭学敏;基于半监督学习的运动想象脑-机接口研究[D];重庆大学;2015年
2 孙博良;在线半监督学习理论、算法与应用研究[D];国防科学技术大学;2014年
3 徐雪;样本的几何信息在半监督学习中的应用研究[D];中国科学技术大学;2010年
4 孔怡青;半监督学习及其应用研究[D];江南大学;2009年
5 兰远东;基于图的半监督学习理论、算法及应用研究[D];华南理工大学;2012年
6 唐晓亮;基于神经网络的半监督学习方法研究[D];大连理工大学;2009年
7 余国先;高维数据上的半监督学习研究[D];华南理工大学;2013年
8 潘俊;基于图的半监督学习及其应用研究[D];浙江大学;2011年
9 王娇;多视图的半监督学习研究[D];北京交通大学;2010年
10 桂杰;基于图的半监督学习和维数约简方法及其应用研究[D];中国科学技术大学;2010年
相关硕士学位论文 前10条
1 李南;基于属性偏序结构理论的半监督学习方法研究[D];燕山大学;2015年
2 路同强;基于半监督学习的微博谣言检测研究[D];山东大学;2015年
3 杜俊;半监督学习及其在社交媒体分析中的应用[D];华北电力大学;2015年
4 王俊超;在线半监督学习尺度自适应鲁棒目标跟踪[D];湘潭大学;2015年
5 薛巍;基于半监督学习的人脸特征抽取方法研究[D];扬州大学;2015年
6 黄f^;网站的可信度分析[D];福州大学;2013年
7 王雷;基于半监督学习的中文问句分类[D];安徽工业大学;2016年
8 向铭;基于半监督学习的室内WLAN支持向量回归定位算法[D];重庆邮电大学;2016年
9 张倚天;基于商品特征挖掘的在线评论有用性分类研究[D];大连理工大学;2016年
10 曹琳琳;基于低秩描述的自适应半监督学习[D];西安电子科技大学;2015年
,本文编号:1552450
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/1552450.html