基于Bagging的两阶段特征选择集成分类器研究

发布时间:2018-08-16 15:44
【摘要】:集成分类是利用分类器互补关系有效提高泛化能力的多分类器集成方法,日益成为机器学习的新的研究方向,在多个领域得到了有效应用。集成分类器性能指标关键在于两个方面因素的制约:一是个体分类器的精度,二是成员分类器相互间的差异化。目前大部分算法设计都是通过扰动训练集并以此来设计差异性较大的基分类器,如Bagging与Boosting算法等。如何获取成员分类器相互间较大差异化的同时提高成员分类器的精度,是当前集成学习研究的热点。本文提出了一种基于Bagging的两阶段特征选择集成分类器,从差异化成员分类器和提高成员分类器精度两个方面考虑,进一步提高集成效果。该集成分类器通过两阶段特征选择双重扰动训练集来提高个体分类器的精度和多样性,并选择性集成差异较大的个体分类器,最终运用加权投票思想输出分类结果。该集成分类器已运用于局部放电故障诊断的实际应用中,能有效地识别局部放电的类型,及时准确地对变压器的绝缘状况进行评估。主要工作如下:(1)提出了一种改进的集成分类器,通过融合Bagging算法和两阶段特征选择相结合方法来双重扰动训练集,来构建不同的输入空间,达到提高个体分类器多样性和精度的目的。(2)采用IAS算法对成员分类器进行差异化选择,并再次选用遗传算法择优,加权输出最终结果。实验表明,本集成分类器较其他集成分类器能获得较优的个体分类器精度和较大差异性的个体分类器组合。(3)在局部放电故障诊断实际问题中验证了本集成分类器。通过实验选择了熵值法、互信息、特征增减法作为两阶段方法的构成元素,选用SVM算法作为构建方法。实验表明,该集成分类器能较准确地识别出放电类别。同时,本集成分类器作为某商用变压器局放故障检测产品的内嵌挂块得到了应用。
[Abstract]:Ensemble classification is a multi-classifier ensemble method which can effectively improve generalization ability by using the complementary relationship of classifiers. It has become a new research direction of machine learning and has been effectively applied in many fields. The performance index of integrated classifier is restricted by two factors: the accuracy of individual classifier and the difference between member classifiers. At present, most algorithms are designed by perturbation training set to design the base classifier, such as Bagging and Boosting algorithms. How to obtain greater differences between member classifiers and improve the accuracy of member classifiers is a hot topic in the field of integrated learning. In this paper, a two-stage feature selection ensemble classifier based on Bagging is proposed. Considering the difference member classifier and improving the precision of the member classifier, the ensemble effect can be further improved. This ensemble classifier improves the accuracy and diversity of individual classifiers by selecting a dual disturbance training set for two-stage feature selection and selectively integrates individual classifiers with large differences. Finally the weighted voting idea is used to output the classification results. The integrated classifier has been applied to the practical application of partial discharge fault diagnosis. It can effectively identify the type of partial discharge and evaluate the insulation condition of transformer in time and accurately. The main work is as follows: (1) an improved ensemble classifier is proposed, which combines the Bagging algorithm and the two-stage feature selection method to construct different input space. To improve the diversity and accuracy of individual classifier. (2) IAS algorithm is used to select the member classifier and genetic algorithm is used again to select the best and the final result is weighted. The experimental results show that the ensemble classifier can obtain better individual classifier accuracy and more different individual classifier combination than other integrated classifiers. (3) this integrated classifier is verified in the practical problem of partial discharge fault diagnosis. The entropy method, mutual information method, feature addition and subtraction method are selected as the components of the two-stage method, and the SVM algorithm is chosen as the construction method. The experimental results show that the integrated classifier can identify the discharge types more accurately. At the same time, the integrated classifier is used as the embedded block of a commercial transformer PD fault detection product.
【学位授予单位】:郑州大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP181

【相似文献】

相关期刊论文 前10条

1 朱玉莲;;局部Bagging方法及其在人脸识别中的应用(英文)[J];Transactions of Nanjing University of Aeronautics & Astronautics;2010年03期

2 王立;朱学峰;;一种基于迭代Bagging的回归算法[J];控制工程;2009年01期

3 谢元澄;杨静宇;;删除最差基学习器来层次修剪Bagging集成[J];计算机研究与发展;2009年02期

4 李明方;张化祥;;针对不平衡数据集的Bagging改进算法[J];计算机工程与应用;2010年30期

5 刘青,李海峰,袁科;微阵列数据中一种改进Bagging决策树算法的研究[J];计算机工程与科学;2005年06期

6 张震,胡捍英;基于属性Bagging kNN性能的增强[J];计算机工程;2005年15期

7 谢元澄;杨静宇;;基于基学习器差异度的层次化Bagging集成修剪[J];信息与控制;2009年04期

8 秦姣龙;王蔚;;Bagging组合的不平衡数据分类方法[J];计算机工程;2011年14期

9 赵苏;李秀;刘文煌;;基于分类器性能评价的Bagging文本分类算法[J];计算机工程;2008年01期

10 魏浩;丁要军;;属性相关选择和Bagging算法在入侵检测中的应用[J];电子测试;2014年06期

相关会议论文 前10条

1 钮冰;陆文聪;金雨欢;;利用Bagging算法预测生物膜蛋白类型[A];中国化学会第26届学术年会化学信息学与化学计量学分会场论文集[C];2008年

2 王占一;徐蔚然;刘东鑫;郭军;;一种基于两级分类器的垃圾短信过滤方法[A];第五届全国信息检索学术会议论文集[C];2009年

3 翟静;李海宏;唐常杰;陈敏敏;李智;;可验证对象集分类器的再训练演进[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年

4 陈继航;刘家锋;赵巍;唐降龙;;联机手写识别笔段特征分类器的学习方法[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年

5 穆明生;;基于特征集的多种分类器模型的在线笔迹认证[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年

6 彭涛;左万利;赫枫龄;;基于链接上下文的分类器主题爬行技术(英文)[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年

7 王岚;陈珂;迟惠生;;基于多特征组合多分类器的方法用于“与文本无关”的说话人辨认[A];第四届全国人机语音通讯学术会议论文集[C];1996年

8 谢秋玲;;应用于心电图分类的KNN-SVM分类器研究[A];2006中国控制与决策学术年会论文集[C];2006年

9 胡琼;汪荣贵;胡韦伟;孙见青;;基于级联分类器的快速人脸检测方法[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年

10 李兰春;王双成;杜瑞杰;;认知结构评估的动态贝叶斯网络分类器方法[A];2011年中国智能自动化学术会议论文集(第一分册)[C];2011年

相关重要报纸文章 前1条

1 黄明;精子分类器决定生男生女[N];广东科技报;2000年

相关博士学位论文 前10条

1 张非;对抗逃避攻击的防守策略研究[D];华南理工大学;2015年

2 张文博;多类别智能分类器方法研究[D];西安电子科技大学;2014年

3 许劲松;智能交通中目标检测与分类关键技术研究[D];南京理工大学;2014年

4 赵作林;基于图像分析的北京地区杨树种类识别研究[D];北京林业大学;2015年

5 任亚峰;基于标注和未标注数椐的虚假评论识别研究[D];武汉大学;2015年

6 曹鹏;不均衡数据分类方法的研究[D];东北大学;2014年

7 刘明;分类器组合技术研究及其在人机交互系统中的应用[D];北京交通大学;2008年

8 严志永;在划分数据空间的视角下基于决策边界的分类器研究[D];浙江大学;2011年

9 王U,

本文编号:2186434


资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/2186434.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户fe780***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com