当前位置:主页 > 科技论文 > 自动化论文 >

基于聚类集成的半监督分类算法研究

发布时间:2020-12-13 22:32
  在许多真实的大数据场景中,样本属性可通过传感器方便且廉价地获取,而其标签则需要专家给出,困难且昂贵。这导致未标记数据多,有标记数据少。如果只使用少量已标记的样本进行学习,传统的有监督学习算法训练得到的分类模型,往往存在欠拟合等缺点,导致分类精度不高。半监督分类充分利用未标记样本,提升分类器精度,近年来被广泛用于智能信息处理、图像处理、生命科学等领域。该方向主要有基于差异的方法、生成式方法、判别式方法和基于图的方法等。这些方法性能优越,并且数学理论完备、计算速度优越、分类精度出众等特点。然而,它们没有充分考虑未标记数据分布的不确定性与复杂性,导致算法的稳定性和鲁棒性欠佳。集成学习可以减少半监督分类中无标记样本的标注过程的不确定性,优化半分类决策边界问题,提升算法的抗干扰能力和可靠性。但是,半监督学习适用于标记样本缺乏的情况,而传统的集成学习本身就需要大量的标记样本进行训练,这两者之间存在矛盾。基于此,本文提出一种基于聚类集成的半监督分类方法,一方面提升了半监督分类的稳定性,另一方面解决了半监督分类与集成学习之间对标记样本的需求矛盾。该方法包含了以下两个的算法:1.结合初始中心优化和属性加... 

【文章来源】:西南石油大学四川省

【文章页数】:58 页

【学位级别】:硕士

【部分图文】:

基于聚类集成的半监督分类算法研究


图2-1聚类算法类型及相关代表算法??

基于聚类集成的半监督分类算法研究


五种聚类方法在PC指标上的比较结果

基于聚类集成的半监督分类算法研究


五种聚类方法在RI指标上的比较结果

【参考文献】:
期刊论文
[1]半监督集成学习综述[J]. 蔡毅,朱秀芳,孙章丽,陈阿娇.  计算机科学. 2017(S1)
[2]用大智慧实现大数据的大价值[J]. 徐宗本.  新湘评论. 2016(22)
[3]基于K-means聚类的大学教学管理利益相关者分析[J]. 胡海涛,朱建民.  湘潭大学自然科学学报. 2015(03)
[4]基于改进遗传模拟退火K-means的心电波形的分类研究[J]. 何云斌,张晓瑞,万静,李松.  计算机应用研究. 2014(11)
[5]基于数据挖掘技术的电子商务旅游线路推荐系统[J]. 张华.  软件. 2013(03)
[6]高通量转录组测序的数据分析与基因发掘[J]. 周华,张新,刘腾云,余发新.  江西科学. 2012(05)
[7]聚类集成方法研究[J]. 杨草原,刘大有,杨博,池淑珍,金弟.  计算机科学. 2011(02)
[8]半监督学习研究进展[J]. 梁吉业,高嘉伟,常瑜.  山西大学学报(自然科学版). 2009(04)
[9]基于成对约束的判别型半监督聚类分析[J]. 尹学松,胡思良,陈松灿.  软件学报. 2008(11)
[10]基于近邻传播算法的半监督聚类[J]. 肖宇,于剑.  软件学报. 2008(11)

博士论文
[1]聚类集成关键技术研究[D]. 罗会兰.浙江大学 2007



本文编号:2915290

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2915290.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3dbef***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com