当前位置:主页 > 医学论文 > 医卫管理论文 >

面向慢性病辅助诊断的多标签学习算法研究

发布时间:2020-07-02 17:03
【摘要】:在医疗健康服务领域,数据分析技术常用于辅助医生进行疾病诊断。在诊断慢性病时,由于其成因复杂并有很大的概率可能引发相应的并发症,导致许多患者可能同时患有超过一个疾病,因此慢性病的辅助诊断模型需要为医生推荐多个可能的疾病,从而帮助医生发现患者更多潜在的疾病。由于多标签学习算法可以同时输出多个与预测样本相关的结果,所以多标签学习算法是一种非常适用于构建慢性病的疾病诊断模型的算法。但是,现有的多标签学习算法在医疗数据分析上还存在很多局限性。论文以提升慢性病的辅助诊断模型性能为目标,针对多标签学习算法在分析医疗数据中存在的几个关键问题进行了研究。主要工作如下:(1)针对医疗数据中的类别非均衡现象会导致多标签分类学习模型性能降低的问题,提出了一种融合多类集成分类的成对聚合多标签学习算法。对于每一个标签,该算法将多标签学习任务分成一个二元分类任务和多个多分类任务,然后训练一个二元分类器,以及利用一个基于正则化的多类集成分类算法来构建多类分类器,最后聚集二元分类器和多类分类器来预测样本的标签,以提升多标签算法处理非均衡数据的能力。在医疗数据集上实现该算法,并对比其他多个多标签算法的实验结果,验证了融合多类集成分类的成对聚合多标签学习算法在分析非均衡医疗数据上的优越性。(2)针对采用医疗数据的所有症状指标训练的多标签学习模型的准确度较低和训练效率较低的问题,提出了一种基于特征信息的多标签学习算法。该算法首先采用概率邻域图模型计算特征空间中实例的相关性,然后采用余弦相似性计算标签空间中标签的相关性。对于多标签数据,该算法不仅可以实现为每个标签选出标签特定特征的功能,而且还可以实现为样本预测一组相关的标签的功能。在医疗数据集上的实验结果表明该算法在提升慢性病的辅助诊断模型性能的效用。此外,本文还使用其他的公开数据集进行实验,验证了该算法的通用性和优越性。(3)为了分析多种疾病的相关性,提升多标签学习模型的准确性和高效性,提出了一种基于标签相关性的快速RAkEL算法。为了实现充分利用标签的相关性,该算法首先基于欧几里得相似度计算每个样本的k近邻,并为每个标签构建标签近邻标记矩阵和标签近邻缺失矩阵,然后分别根据标签近邻标记矩阵的相似度和标签近邻缺失矩阵的相似度来衡量标签的正相关性和负相关性,最后根据标签正相关性和负相关性来选择标签子集。选定标签子集后,对于每一个标签子集,首先采用回归模型把样本分为相关与不相关的两个类,接着用LP模型训练相关的样本,从而实现高效的多标签学习。通过在医疗数据集上进行实验,验证了提出的算法能够提高慢性病的辅助诊断模型的精度和效率。并且,在其他公开数据集上的实验结果表明该算法具有更优越的性能。
【学位授予单位】:海南大学
【学位级别】:博士
【学位授予年份】:2019
【分类号】:TP391.41;R-05
【图文】:

步骤,标签,慢性病,样本


那么多标签学习就退化为传统的单标签(单类)监督学习。多标签学习的目的逡逑是尽可能为标签未知的样本找到相关的标签,多标签学习模型的输出可能包含一个或逡逑者多个标签的标签集合。多标签学习的步骤如图1-4所示。因此,可以把识别患者可逡逑能的慢性病的任务转化为机器学习中的多标签学习任务。逡逑标注的样本逡逑训练逡逑,,逦睡可能的标签1邋k逡逑—N一N逦.多标签学逦M;WJ邋.逡逑未标注的样本邋逦^习模型邋逦^逡逑图1-4多标签学习的步骤逡逑Fig.邋1-4邋Phases邋of邋multi-label邋learning逡逑在医疗领域,己经有研究人员进行了采用多标签学习算法构建慢性病的辅助诊断逡逑模型的研宄。Ira邋Goldstein等从I2B2邋2008数据中提取出肥胖症及其他15种并发症的逡逑患者数据,把每一类视为一个标签,为每一个类训练一个分类器,然后对这些疾病进逡逑行多标签学习(Goldstein邋et邋al.,2009)。Damien邋Rey等利用多标签学习算法分析病人可逡逑能患有的多个慢性疾病(Damien邋et邋al.,邋2015)。马洪超等根据产科的入院诊断包含正常逡逑诊断和并发症等实际情况,采用多标签分类算法对产科电子病历进行自动诊断(马洪逡逑超等,2018)。Li等将中药方剂与中医症候关系转化为个多实例学习和多标签学习问逡逑题

逻辑框架,论文,学习算法


1.5论文的结构逡逑本文可概括为机器学习技术与医学数据分析两者中的交叉研究。本文的逻辑框架逡逑图如图1-5所示。逡逑第一章绪论逡逑—二IZ—逡逑第二章多标签学习算法的研逡逑栜述逡逑逦一 ̄1^一邋逦逡逑而向慢性病辅助诊断的多标签学Al算法研究逦^逡逑类别非均衡逦样本特征数量大逦多个标签相互关联逡逑第三章融合多类集成分类逦第四章基于特征信息的多逦第五章基于标签相关性的逡逑的成对聚合多标签学习算法逦标签学习算法逦快速RAkEL算法逡逑V逦逦/逡逑晷逡逑第六章总结与展望逡逑图1-5论文的逻辑框架图逡逑Fig.1-5邋Logical邋framework邋of邋the邋paper逡逑章节安排如下:逡逑第一章:绪论。本章首先阐述了论文的研宄背景和研究意义。接着,简述了单标逡逑签学习与多标签学习的差异,论述了基于单标签学习算法的辅助诊断研究现状和基于逡逑多标签学习算法的辅助诊断研宄现状,指出了面向慢性病辅助诊断的多标签算法面临逡逑的关键问题。最后,基于前文的讨论提炼出论文的研究内容及结构。逡逑第二章:多标签学习算法的研宄综述。本章首先对多标签学习算法进行描述,然逡逑后对多标签学习算法展开分类讨论,论述了经典的问题转换的多标签学习算法和算法逡逑适应的多标签学习算法,并介绍了针对类别非均衡的多标签学习算法和多标签特征维逡逑度约简算法的研究现状

【参考文献】

相关期刊论文 前4条

1 胡学钢;许尧;李培培;张玉红;;一种过滤式多标签特征选择算法[J];南京大学学报(自然科学);2015年04期

2 王霄;周李威;陈耿;朱玉全;;一种基于标签相关性的多标签分类算法[J];计算机应用研究;2014年09期

3 张振海;李士宁;李志刚;陈昊;;一类基于信息熵的多标签特征选择算法[J];计算机研究与发展;2013年06期

4 郑伟;王朝坤;刘璋;王建民;;一种基于随机游走模型的多标签分类算法[J];计算机学报;2010年08期

相关博士学位论文 前2条

1 王普;多标记学习算法研究及在生物医学数据挖掘中的应用[D];中国科学院大学(中国科学院深圳先进技术研究院);2017年

2 王昱;基于电子病历数据的临床决策支持研究[D];浙江大学;2016年

相关硕士学位论文 前1条

1 胡玮;基于改进邻域粗糙集和随机森林算法的糖尿病预测研究[D];首都经济贸易大学;2018年



本文编号:2738449

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/yiyuanguanlilunwen/2738449.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户06a45***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com