当前位置:主页 > 科技论文 > 自动化论文 >

面向在线不均衡数据分类的极限学习机算法研究

发布时间:2017-11-21 21:41

  本文关键词:面向在线不均衡数据分类的极限学习机算法研究


  更多相关文章: 极限学习机 不均衡分类 在线贯序数据 主曲线 留一交叉验证


【摘要】:在实际工程问题中,存在大量的类别不均衡问题,如故障诊断、网络入侵检测等。且该类问题具有明显的时间特点,尤其是在大规模数据环境下,数据通常是按序到达,是一种典型的在线不均衡分类问题。极限学习机作为一种单隐层前馈神经网络,具有极端快速的特点,同时其泛化性能良好,可有效解决在线贯序数据的分类问题。然而,极限学习机通常是以提高样本整体的分类精度为目标,当类别严重不均衡时,极易导致分类面偏移,造成“虚假”的分类效果。因此,本文将根据数据特点和应用需求,在前端充分采集数据和处理数据的基础上,进行后端机器学习理论和算法的研究,提出一系列更适合在线不均衡分类问题的算法。主要工作和贡献如下:(1)为提高不均衡在线贯序数据中少类样本的分类精度,提出一种基于不均衡样本重构的加权在线极限学习机算法。该算法的关键是在提取数据分布特性的基础上,对不均衡样本重构。为此,引入主曲线的概念,并在此基础上改进SMOTE方法,从而提高少类样本的过采样质量,同时,为突出样本重要性,采用动态加权的思想,根据训练误差为在线样本赋以相应大小的权重。最终在不增加算法复杂度的前提下,对少类样本的预测精度更高,同时数值稳定性良好。(2)针对现有分类算法泛化性能较低的问题,提出一种基于留一交叉验证的在线极限学习机算法,既实现了对在线泛化误差的快速有效估计,又大大降低了时间复杂度。为解决在线样本的不均衡问题,根据留一误差进行欠采样,同时,为保证模型的简约性,采用增删机制动态更新网络权值,并从信息熵的角度给出在线欠采样过程中存在损失信息上界,进而从理论上证明了该算法的有效性。(3)为进一步提高不均衡在线数据中少类样本的识别率,同时尽可能减少多类样本的分类精度损失,提出一种基于混合采样策略的在线极限学习机算法。该算法在遵循样本分布特性的同时,根据样本重要度指标筛选最具价值的样本点,实现样本重构。同时为保证模型的泛化性能,根据在线留一误差进行动态模型调整,以确保最优网络结构,并通过理论分析和大量仿真实验证明该算法的合理性和有效性。本文研究不仅拓宽了极限学习机的理论与算法研究,也为在线不均衡分类问题提供了新的解决方案,同时本文所研究的理论和相应算法,均可直接应用于其他领域的信号处理,对于实际工程问题中的不均衡分类问题的解决,如网络入侵检测,疾病诊断等,也具有良好的借鉴意义。
【学位授予单位】:河南师范大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP181

【相似文献】

中国期刊全文数据库 前10条

1 葛磊;武芳;王鹏波;张冬林;;3维建筑综合中基于最小特征的面平移算法[J];测绘科学技术学报;2009年02期

2 骆雯,孙延明,陈振威,陈锦昌;判断点与封闭多边形相对关系的改进算法[J];机械;1999年03期

3 李林;卢显良;;一种基于切割映射的规则冲突消除算法[J];电子学报;2008年02期

4 刘巧玲;张红英;林茂松;;一种简单快速的图像去雾算法[J];计算机应用与软件;2013年07期

5 林亚平,杨小林;快速概率分析进化算法及其性能研究[J];电子学报;2001年02期

6 章郡锋;吴晓红;黄晓强;何小海;;基于暗原色先验去雾的改进算法[J];电视技术;2013年23期

7 杨铁军;靳婷;;一种动态整周模糊值求解算法及其仿真分析[J];系统工程与电子技术;2007年01期

8 周秀玲;郭平;陈宝维;王静;;几种计算超体积算法的比较研究[J];计算机工程;2011年03期

9 吴一戎,胡东辉,彭海良;Chirp Scaling SAR成象算法及其实现[J];电子科学学刊;1995年03期

10 王贵竹;一种产生单向分解值的算法[J];安徽大学学报(自然科学版);2001年03期

中国重要会议论文全文数据库 前10条

1 尹冀锋;;一种新的图象自适应增强算法[A];四川省通信学会一九九二年学术年会论文集[C];1992年

2 宁春平;田家玮;郭延辉;王影;张英涛;郑桂霞;刘研;;计算机辅助增强、分割算法在鉴别乳腺良、恶性肿块中的应用价值[A];中华医学会第十次全国超声医学学术会议论文汇编[C];2009年

3 谢丽聪;;SVB查询改写算法的改进[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年

4 郑存红;;复杂背景下相关跟踪算法研究及DSP实现[A];中国光学学会2010年光学大会论文集[C];2010年

5 杨文杰;吴军;;RFID抗冲突算法研究[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年

6 高山;毕笃彦;魏娜;;一种基于UPF的小目标TBD算法[A];第十四届全国图象图形学学术会议论文集[C];2008年

7 周磊;张卫华;王晓奇;张军;;基于流水算法的智能路障机器人设计[A];2011年全国电子信息技术与应用学术会议论文集[C];2011年

8 潘巍;李战怀;陈群;索博;李卫榜;;面向MapReduce的非对称分片复制连接算法优化技术研究[A];第29届中国数据库学术会议论文集(B辑)(NDBC2012)[C];2012年

9 李伟伟;蔡康颖;郑新;王文成;;3D模型中重复结构的多尺度快速检测算法[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年

10 杨任尔;陈恳;励金祥;;基于棱边方向检测的运动自适应去隔行算法[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年

中国重要报纸全文数据库 前1条

1 国泰君安资产管理部;“算法交易”是道指暴跌罪魁祸首?[N];上海证券报;2010年

中国博士学位论文全文数据库 前10条

1 冯辉;网络化的并行与分布式优化算法研究及应用[D];复旦大学;2013年

2 许玉杰;云计算环境下海量数据的并行聚类算法研究[D];大连海事大学;2014年

3 李琰;基于猫群算法的高光谱遥感森林类型识别研究[D];东北林业大学;2015年

4 陈加顺;海洋环境下聚类算法的研究[D];南京航空航天大学;2014年

5 王洋;基于群体智能的通信网络告警关联规则挖掘算法研究[D];太原理工大学;2015年

6 雷雨;面向考试时间表问题的启发式进化算法研究[D];西安电子科技大学;2015年

7 熊霖;大数据下的数据选择与学习算法研究[D];西安电子科技大学;2015年

8 周雷;基于图结构的目标检测与分割算法研究[D];上海交通大学;2014年

9 王冰;人工蜂群算法的改进及相关应用的研究[D];北京理工大学;2015年

10 蒋亦樟;多视角和迁移学习识别方法和智能建模研究[D];江南大学;2015年

中国硕士学位论文全文数据库 前10条

1 姚鑫宇;EMD去噪与MUSIC算法在DOA估计中的联合应用[D];昆明理工大学;2015年

2 陆进;面向含噪数据聚类相关算法的研究[D];复旦大学;2014年

3 叶一舟;红外弱小目标检测算法研究[D];上海交通大学;2015年

4 王继重;基于Hadoop和Mahout的K-Means算法设计与实现[D];大连海事大学;2016年

5 何静;遥感图像的快速压缩算法研究[D];北京交通大学;2016年

6 章华燕;钢轨擦伤检测算法研究[D];北京交通大学;2016年

7 王一博;MODIS地震热异常的数据处理与算法研究[D];中国石油大学(华东);2014年

8 成鑫;基于组合优化问题的多目标模因算法的研究[D];南京航空航天大学;2015年

9 傅致晖;基于协同分割的视频目标分割算法研究[D];上海交通大学;2015年

10 张媛;运动车辆检测与跟踪算法的研究与实现[D];大连海事大学;2016年



本文编号:1212372

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1212372.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户dc3a6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com