当前位置:主页 > 医学论文 > 传染病论文 >

基于集成学习的传染性肝病辅助诊断系统的研究与实现

发布时间:2020-04-04 19:50
【摘要】:传染性肝病是一类分布极为广泛的传染病,其传染性高且传播途径多样,对社会有巨大的影响。传染性肝病通常根据标志物指标进行诊断,但是当疾病处于非急性期时,标志物指标的不显著与不稳定为诊断带来很大困难。因此利用机器学习的方法,发掘大量特征与疾病之间隐含的联系,是传染性肝病诊断研究的主要方向之一。本研究以传染性肝病的诊断为主要研究对象,探讨诊断模型训练过程中的特征选择方法与分类模型的设计。本文首先使用改进的集成特征选择方法对数据进行特征选择,然后采用集成学习方法构建分类模型并进行集成剪枝,最后完成分布式传染性肝病的辅助诊断系统的设计与实现。本文具体工作如下:(1)提出一种新的集成特征选择方法CB-EFS。CB-EFS方法首先对多种特征选择器得到的特征子集进行聚类,得到更具差异性的子集来增强集成性能,接着对这些子集进行投票集成,选择排名较高的特征。该方法主要有两点创新:其一,针对进行聚类的特征子集较少,使用传统的基于漂移均值聚类方法时难以确定聚类中窗口半径从而无法得到最优的聚类结果的问题进行改进。首先多次使用不同窗口半径进行聚类得到多个簇心组,对得到的所有簇心再次聚类,得出簇心分布规律,从而选出簇心组中具有代表性且差异性较大者作为聚类结果,得到更优聚类表现。其二,对特征子集进行集成时,原始的波达投票方法虽可以很好的选出被大多数选择器认可的特征,但其简单的根据位次线性加权的方法会导致部分在少数子集中表现好的特征无法获得较高的最终排名,对此本文采用改进的非线性加权方法,使此类特征获得更高权重与更大的被选中概率,并且能更直观看出所有特征的重要性程度。实验结果表明,使用CB-EFS方法分类的准确度相比于使用其他特征选择方法平均提升0.998%,且具有较好的敏感性和稳定性。(2)集成分类模型通过集成多个基分类器来得到更好的分类性能,但是使用过多的分类器会降低集成模型的泛化能力和分类速度,并且会出现由于部分基分类器冗余而造成计算资源浪费的情况。因此,通过集成剪枝从集成中去除部分分类器可以提高集成性能、节省计算资源。本文对帕累托集成剪枝方法进行改进,提出三目标优化集成剪枝方法,在原有的最大化分类准确度和最小化集成规模两个优化目标的基础上,加入最大化基分类器差异度目标,以解决原方法存在的过拟合问题。同时,针对满足这三个目标的帕累托最优解稀少的情况,将算法求解方式进行优化。实验结果表明,使用该剪枝方法的集成分类模型准确度相比使用原方法平均提升0.67%,且模型过拟合程度明显降低。(3)在上述研究的基础上,完成基于Hadoop的分布式传染性肝病辅助诊断系统的设计与实现,实现对传染性肝病的智能诊断并对疾病的传播趋势等情况进行统计与可视化展示。
【图文】:

组件关系,集成学习,预测性能


图2.3邋Hadoop组件关系图逡逑

聚类,样本点组,样本集,特征子集


6.逦更新特征集R邋=邋[p>,R]逡逑7.逦在S中去除次特征:F邋=逡逑加入SVM-RFE方法后本章采用的集成特征选择基本流程如图3.1所示:逡逑/邋原始特征邋^逡逑过滤&特征逦过滤5特征逦过滤1特征逦SVM-r7f4寺征逡逑选择方法1逦选择方法2逦选择方法7逦选择方法逡逑/邋mi邋^7邋/邋特;^7逦/邋特;^7邋/邋特;^7逡逑/邋子-集1逦/逦/邋子-集2逦/逦…/逦子-集7逦/逦/邋子-集8逦/逡逑投票集成逡逑/^最终、寺征^7逡逑/邋—邋/逡逑图3.1集成特征选择方法基本流程逡逑3.1.2聚类及均值漂移聚类逡逑在增加集成差异度第二个方面一一增加特征选择后特征子集的差异度,本章逡逑对七种过滤式特征选择器得到的特征子集进行基于均值漂移聚类,自动从某些相逡逑似的特征子集中选出一个具有代表性的特征子集,从而避免这些相似子集在集成逡逑中占据过高权重,侧面增加了集成的差异度。使用聚类的集成特征选择方法流程逡逑如图3.2所示:逡逑聚类是一种非常常用的机器学习方法。聚类(Clustering)根据某个标准将一逡逑个样本集分割为不同的簇(Cluster),使得在同一个簇中的样本的相似性尽可能逡逑大,,且不在同一个簇中的样本的差异性尽可能大[35]。逡逑聚类是一种无监督学习方法,在进行聚类时不需要关心得到的聚类是什么或逡逑需要加上什么标签
【学位授予单位】:江苏大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:R512.6;TP181

【相似文献】

相关期刊论文 前10条

1 徐继伟;杨云;;集成学习方法:研究综述[J];云南大学学报(自然科学版);2018年06期

2 武玉英;严勇;蒋国瑞;;基于动态选择性集成学习的供应链产销协商优化策略[J];计算机工程;2017年05期

3 张沧生;崔丽娟;杨刚;倪志宏;;集成学习算法的比较研究[J];河北大学学报(自然科学版);2007年05期

4 郭福亮;周钢;;集成学习中预测精度的影响因素分析[J];兵工自动化;2019年01期

5 曾一平;;基于集成学习的小麦识别研究[J];现代商贸工业;2019年17期

6 米硕;孙瑞彬;李欣;明晓;;集成学习在文本分类问题中的应用[J];中国新通信;2018年09期

7 李晔;刘胜利;张兆林;;基于漂移检测和集成学习的木马检测模型[J];信息工程大学学报;2017年06期

8 徐桂云;陈跃;张晓光;刘云楷;;基于选择性集成学习的焊接缺陷识别研究[J];中国矿业大学学报;2011年06期

9 张春霞;张讲社;;选择性集成学习算法综述[J];计算机学报;2011年08期

10 饶峰;;核机器集成学习算法的误差分析[J];重庆文理学院学报(自然科学版);2010年04期

相关会议论文 前10条

1 关鹏洲;王梦毫;李倩;;基于集成学习和深度学习的短期降雨预测模型[A];2017年(第五届)全国大学生统计建模大赛获奖论文选[C];2017年

2 杜方键;杨宏晖;;K均值聚类优化集成学习[A];2011'中国西部声学学术交流会论文集[C];2011年

3 倪志伟;张琛;倪丽萍;;基于萤火虫群优化算法的选择性集成霾天气预报方法[A];中国系统工程学会第十八届学术年会论文集——A12系统科学与系统工程理论在各个领域中的应用研究[C];2014年

4 李烨;蔡云泽;许晓鸣;;基于支持向量机集成的故障诊断[A];第16届中国过程控制学术年会暨第4届全国故障诊断与安全性学术会议论文集[C];2005年

5 吴龙飞;孙浩;计科峰;;基于集成映射的半监督图像分类方法[A];第八届全国信号和智能信息处理与应用学术会议会刊[C];2014年

6 邱诚;倪子伟;陈珂;苏旋;邹权;;基于聚类方法的基分类器选择策略研究[A];第29届中国数据库学术会议论文集(B辑)(NDBC2012)[C];2012年

7 张红梅;;基于粗糙集特征约简的SVM集成入侵检测模型[A];2009中国控制与决策会议论文集(3)[C];2009年

8 程丽丽;张健沛;杨静;马骏;;一种提高支持向量机集成差异性的学习方法[A];第二十五届中国数据库学术会议论文集(一)[C];2008年

9 刘锟;邢延;蔡延光;;一种针对交互式学习系统日志数据的轻型化挖掘方法[A];2011年中国智能自动化学术会议论文集(第一分册)[C];2011年

10 刘伍颖;王挺;;一种多过滤器集成学习垃圾邮件过滤方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

相关重要报纸文章 前1条

1 本报记者 张晔;人脑比电脑更重要[N];科技日报;2008年

相关博士学位论文 前10条

1 李艳秋;基于集成学习的人脸识别研究[D];合肥工业大学;2018年

2 赵鹤;面向高维大数据的子空间集成学习方法研究[D];中国科学院大学(中国科学院深圳先进技术研究院);2017年

3 刘天羽;基于特征选择技术的集成学习方法及其应用研究[D];上海大学;2007年

4 侯勇;特征提取与集成学习算法的研究及应用[D];北京科技大学;2015年

5 孙永宣;集成学习下的图像分析关键问题研究[D];合肥工业大学;2013年

6 尹华;面向高维和不平衡数据分类的集成学习研究[D];武汉大学;2012年

7 阿里木·赛买提(Alim.Samat);基于集成学习的全极化SAR图像分类研究[D];南京大学;2015年

8 刘冲;模拟电路故障诊断AdaBoost集成学习方法研究[D];大连海事大学;2011年

9 钮冰;基于集成学习算法的若干生物信息学问题研究[D];上海大学;2009年

10 程丽丽;支持向量机集成学习算法研究[D];哈尔滨工程大学;2009年

相关硕士学位论文 前10条

1 吕克敌;基于集成学习与进化算法的停车位预测算法研究[D];吉林大学;2019年

2 沈先宝;基于集成学习的分类系统的研究及实现[D];江苏大学;2019年

3 董凤伟;基于集成学习的传染性肝病辅助诊断系统的研究与实现[D];江苏大学;2019年

4 常建芳;基于集成学习和卷积神经网络的太阳能辐照度预测方法[D];天津大学;2018年

5 叶明;基于集成学习的疾病辅助诊断关键技术研究与实现[D];郑州大学;2019年

6 邸研哲;基于相似性方法的药物—疾病相互作用关系预测[D];安徽大学;2019年

7 雍振煌;基于评论极性与集成学习的微博谣言检测研究[D];武汉理工大学;2018年

8 朱俊;选择性集成学习及其应用研究[D];华东交通大学;2016年

9 郑丽容;基于聚类和动态更新的启发式选择性集成学习算法[D];厦门大学;2017年

10 李辉华;基于集成学习的出租车预计到达时间预测[D];厦门大学;2018年



本文编号:2614005

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/chuanranbingxuelunwen/2614005.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9ccc0***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com