当前位置:主页 > 医学论文 > 医卫管理论文 >

面向疾病预测的半监督学习算法研究

发布时间:2020-05-10 14:45
【摘要】:近几年,医疗大数据受到了人们的广泛关注,如何充分利用海量的临床数据挖掘出其内在的重要信息知识,对隐患的疾病甚至癌症做出预测诊断,从而让病患得以预防或提前医治,将具有重大的意义。从新生儿脑瘫预测出发,本文试图通过大数据挖掘找到一个适用于医疗预测场景且具有较高预测准确度和较低模型总体损失的学习算法,使其不仅能够对新生儿脑瘫做出最大程度的正确预测,而且对其他几种特定的疾病预测都能有效应用。本文重点研究了半监督学习算法,并且对医学预测场景下的半监督学习算法出现的问题进行了模型改进,主要取得了以下成果。一、针对医学数据集设计了一套数据预处理方法流程。由于医学临床数据无法直接建模,本文通过填充数据缺失值、处理不一致性数据、检测离群点,先对脏数据进行清洗。然后对多个临床数据源的数据集进行对象匹配和模式集成,并对各个字段属性进行冗余性和相关性分析。最后对数据集进行特征缩放和维数归约。实验验证了该方案可有效加强数据可用性,并可提升数据集在建模过程中的计算效率。二、根据医学数据集中有标记样本过少、无标记样本较多的特点,将半监督学习算法应用到脑瘫预测等特定疾病预测模型。已知有监督学习在疾病预测场景中已有研究,本文对有监督学习中性能较好的混合高斯模型、支持向量机模型、图模型,与其在半监督学习领域分别对应的半监督混合高斯模型、半监督支持向量机模型、半监督图模型做出了理论推导和构思技巧的对比分析。通过在8个数据集上设计3种有标记样本数量比例,仿真实验在3种评估指标的均值结果上均验证得出:半监督学习算法在脑瘫预测等疾病预测模型中具有性能优势,且半监督支持向量机模型的表现最好。三、针对医疗场景下出现的问题,提出基于半监督支持向量机的改进算法模型。其一,基于误分正类样本损失和误分负类样本损失不对等问题,本文设置不同误分类权重,以加大对误分正类样本的惩罚,从而减小整体误分损失。其二,基于类别极度不平衡数据导致的学习器“傻瓜化”问题,本文对未标记数据中正类样本的数量比例进行条件约束,使得其比例更接近真实样本标签的分布比例。其三,基于有标记和未标记样本数量差别悬殊对目标函数的经验风险项造成的影响,本文对有标记和未标记样本的经验风险函数分别进行了一定比例的缩放,从而减小了因标记数量不均衡造成的预测误差。在理论推导分析后,本文通过详尽的实验分别验证了3个改进步骤在一定程度上提升了模型分类准确度,且降低了模型总体损失。
【图文】:

流程图,方案,流程图


本文方案流程图

半监督学习,数据层


第二章 论文相关关键技术介绍第二章 论文相关关键技术介绍本章对本文所要研究的面向数据挖掘的半监督学习算法中的关键技术进行绍,为后面章节的设计和分析奠定理论基础。 半监督学习机器学习的目标是通过分析大量历史样本数据,基于特定的假设,,挖掘出部规律,建立对应的数学模型,从而对新样本进行更加准确的估计和预icial Intelligence 业界著名专家 Simon 的观点[2]认为“机器学习是从大量历习,使学习器的预测能力改进或增强,从而提高新样本的预测准确率”。如,从数据层面来看,机器学习一般分为三种学习方式:有监督学习,无监督督学习。
【学位授予单位】:西安电子科技大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP181;R-05

【相似文献】

相关期刊论文 前10条

1 王江;张惠源;李芳;张兵文;李鹏;;脑机接口中半监督学习算法研究[J];电子测量技术;2014年05期

2 孙广玲,唐降龙;基于分层高斯混合模型的半监督学习算法[J];计算机研究与发展;2004年01期

3 鲁珂,赵继东,叶娅兰,曾家智;一种用于图像检索的新型半监督学习算法[J];电子科技大学学报;2005年05期

4 杨南海;黄明明;赫然;王秀坤;;基于最大相关熵准则的鲁棒半监督学习算法[J];软件学报;2012年02期

5 缪志敏;胡谷雨;赵陆文;陈彦德;;一种基于支持向量数据描述的半监督学习算法[J];解放军理工大学学报(自然科学版);2010年01期

6 陈志民;薛月菊;杨敬锋;叶志婵;陈剑虹;;半监督学习算法在农用地分等中的应用[J];计算机工程与设计;2008年23期

7 任亚峰;姬东鸿;尹兰;;基于半监督学习算法的虚假评论识别研究[J];四川大学学报(工程科学版);2014年03期

8 李明;杨艳屏;占惠融;;基于局部聚类与图方法的半监督学习算法[J];自动化学报;2010年12期

9 张健沛;赵莹;杨静;;最小二乘支持向量机的半监督学习算法[J];哈尔滨工程大学学报;2008年10期

10 王敬;李淑英;;基于半监督学习算法在文本分类中的应用研究[J];信息与电脑(理论版);2015年17期

相关会议论文 前1条

1 孙涛;刘静;刘青山;卢汉清;;半监督谱判别式分析[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年

相关博士学位论文 前7条

1 杨南海;鲁棒半监督学习算法及在生物统计中的应用研究[D];大连理工大学;2015年

2 邓超;基于“合作—参与”计算认知模型的半监督学习算法研究与应用[D];哈尔滨工业大学;2009年

3 翁立波;基于图的半监督学习算法及其应用[D];南京理工大学;2017年

4 孔怡青;半监督学习及其应用研究[D];江南大学;2009年

5 刘斌;基于图的大规模半监督学习算法及应用研究[D];电子科技大学;2017年

6 季斌;内蒙古浩布高地区多金属矿综合信息找矿预测研究[D];合肥工业大学;2017年

7 张海军;基于云计算的神经网络并行实现及其学习方法研究[D];华南理工大学;2015年

相关硕士学位论文 前10条

1 潘媛;面向疾病预测的半监督学习算法研究[D];西安电子科技大学;2018年

2 唐校辉;基于半监督学习算法的健康大数据分类模型研究与实现[D];电子科技大学;2018年

3 徐寒香;一种基于李群的半监督学习算法及应用研究[D];苏州大学;2009年

4 王轶初;基于集成学习的半监督学习算法研究[D];西安电子科技大学;2011年

5 魏征丽;基于图半监督学习算法的研究及应用[D];西安电子科技大学;2012年

6 张毅锋;一种基于对称矩阵分解的半监督学习算法的研究与应用[D];中山大学;2014年

7 钟吉英;半监督学习算法在脑—计算机接口中的应用研究[D];电子科技大学;2009年

8 李玉娇;半监督学习算法的鲁棒性研究[D];华南理工大学;2016年

9 徐培培;基于LNP的半监督学习算法[D];西安电子科技大学;2009年

10 占惠融;基于图的半监督学习算法研究[D];华中科技大学;2009年



本文编号:2657464

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/yiyuanguanlilunwen/2657464.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9e931***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com