机器学习算法在肌少症诊断中的应用
发布时间:2021-08-11 16:07
近年来智慧医疗飞速发展,利用人工智能技术辅助医疗诊断已经成为趋势,国内外对机器学习辅助医疗的研究的也越发成熟,许多关于疾病的机器学习预诊模型都已建立。采用机器学习算法来辅助医生进行诊断,将会很大程度上提高诊断的科学性,也能有效地克服仅凭医生经验来诊断的主观性问题,还从一定程度上减轻了医生的负担。针对以上研究背景,本文依托于实验室研究项目,对肌少症这一疾病进行研究,建立一个适用于肌少症诊断的机器学习模型。本文在第二、第三章中对相关的理论基础进行的详细的阐述,主要包括数据的处理、模型的评价以及算法介绍几个方面。对机器学习算法的选择上,本文采用支持向量机(SVM)、随机森林(RF)、XGBoost和CatBoost四种算法进行对比研究,对于模型的评价指标,本文选择了准确率、精确率、召回率和F1值四个指标。值得一提的是,本文中的肌少症数据除了包含一些门诊数据之外,也包含了一些行为数据,在第四章中从特征的相关性研究和机器学习算法给出的重要程度排序两方面论证了这些行为特征对预诊模型建立的重要性,从医学诊疗上看也丰富了患者的数据类型。本文在研究的过程中还强调了分类问题中类别均衡对算法训练的重要性,并...
【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校
【文章页数】:52 页
【学位级别】:硕士
【部分图文】:
图1:?smote模拟生成样本图??
硕士学位论文??MASTER'S?THESIS??3.2?RF(Random?Forest)??随机森林(RF)是机器学习中的一种集成算法,它的思想源于Bagging算法,??Bagging的特点是随机釆样,每次都从训练集里有放回地采集固定个数的样本。??对于Bagging算法,一般随机采集样本个数和训练集样本个数一样,对每次采集??好的样本建立一个模型作为弱学习器,采用投票法则选择票数最多的类别作为最??终的输出结果。形象表示如下图:??采样粜1?mu.?弱学习器1?\???采样集2?训练?弱学习器2????M个样本?'?1?强学习器??\样?i?丨?略y/????采样集T?训练?弱学器T?/??图2:?Bagging算法流程图??RF是Bagging算法的进化版,它进行了以下两点改进。????Bagging没有明确规定的弱学习器,RF使用CART决策树W作为弱学习器,??不同于ID3与C4.5,它采用基尼指数来选择最优的节点特征,并且CART是??二分决策树,可用于处理分类和回归问题;???在使用CART决策树的基础上,RF对决策树的建立做了改进,对于普通的决??策树,会从节点上的所有的n个特征中选择一个最优的特征作为决策树的左??右子树划分节点,但是RF通过随机选择节点上的一部分特征,这个数字通??常小于n,假设为nsub,然后在这些随机选择的nsub个样本特征中,选择一个??最优的特征来作为决策树的左右子树划分节点,这样进一步增强了模型的泛??化能力。??RF的算法过程总结如下:??15??
率表现来更新训练样本的权重,使得??第一个弱学习器学习误差率高的训练样本点的权重变高,便于在第二个弱学习器??中进行针对性优化,如此重复进行,直到达到事先给定的迭代次数T,最终将T个??弱学习器通过集合策略进行整合,得到最终的强学习器,如下图所示:??(>^Dl)?|带权市D1|?|弱学习器1??^?训练染??;?\??/?^?\??M个样本训職?卜学习叫强学二m??\:?!^?T^ri:??I:?ifl?/??厂?An?1?/??(u^)?^|DT?^?|弱学习器T??图3:?Boosting算法流程图??16??
【参考文献】:
期刊论文
[1]基于机器学习的神经精神疾病辅助诊断研究进展[J]. 雷炳业,潘嘉瑜,吴逢春,陆小兵,宁玉萍,陈军,吴凯. 中国医学物理学杂志. 2020(02)
[2]老年人肌少症的成因、评估及应对[J]. 王坤,罗炯,刘立,欧阳一毅. 中国组织工程研究. 2019(11)
[3]基于改进神经网络的糖尿病生化指标值预测[J]. 陈德华,洪灵涛,潘乔. 微型机与应用. 2017(05)
[4]武汉地区中老年男性肌肉减少症与骨密度的相关性[J]. 帅波,沈霖,杨艳萍,马陈,徐晓娟,吕林,夏雪. 中华骨质疏松和骨矿盐疾病杂志. 2016(03)
[5]维生素D在骨代谢异常治疗中的多效性[J]. 费锦萍,郭利明. 现代实用医学. 2015(12)
[6]北京高龄老年男性骨骼肌含量减少与行走功能的相关性研究[J]. 张颖,胡亦新,范利,张曼秀,孙静,韩晓琦,马晓娜,董宏艳,李梅. 中华保健医学杂志. 2014(06)
[7]采用不同标准对北京社区男性老年肌少症检出率比较的研究[J]. 李梅,胡亦新,董宏艳,张颖,范利,张曼秀,孙静,韩晓琦,刘云霞,马晓娜. 中华保健医学杂志. 2014(06)
[8]国际体力活动问卷中体力活动水平的计算方法[J]. 樊萌语,吕筠,何平平. 中华流行病学杂志. 2014 (08)
硕士论文
[1]社区居民糖尿病风险预测系统的设计与实现[D]. 苗丰顺.中国科学院大学(中国科学院沈阳计算技术研究所) 2019
[2]加权样本分类算法设计和基于加法逻辑回归模型的Boosting算法设计[D]. 王超.华中师范大学 2019
[3]老年2型糖尿病合并骨质疏松症与肌少症的相关性及影响因素的研究[D]. 肖娜.川北医学院 2019
[4]重庆市主城区中老年体检人群肌肉减少症患病率调查及危险因素分析[D]. 刘利利.重庆医科大学 2019
[5]基于BP神经网络的心血管病预测系统的研究与实现[D]. 李小敏.宁夏大学 2018
本文编号:3336467
【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校
【文章页数】:52 页
【学位级别】:硕士
【部分图文】:
图1:?smote模拟生成样本图??
硕士学位论文??MASTER'S?THESIS??3.2?RF(Random?Forest)??随机森林(RF)是机器学习中的一种集成算法,它的思想源于Bagging算法,??Bagging的特点是随机釆样,每次都从训练集里有放回地采集固定个数的样本。??对于Bagging算法,一般随机采集样本个数和训练集样本个数一样,对每次采集??好的样本建立一个模型作为弱学习器,采用投票法则选择票数最多的类别作为最??终的输出结果。形象表示如下图:??采样粜1?mu.?弱学习器1?\???采样集2?训练?弱学习器2????M个样本?'?1?强学习器??\样?i?丨?略y/????采样集T?训练?弱学器T?/??图2:?Bagging算法流程图??RF是Bagging算法的进化版,它进行了以下两点改进。????Bagging没有明确规定的弱学习器,RF使用CART决策树W作为弱学习器,??不同于ID3与C4.5,它采用基尼指数来选择最优的节点特征,并且CART是??二分决策树,可用于处理分类和回归问题;???在使用CART决策树的基础上,RF对决策树的建立做了改进,对于普通的决??策树,会从节点上的所有的n个特征中选择一个最优的特征作为决策树的左??右子树划分节点,但是RF通过随机选择节点上的一部分特征,这个数字通??常小于n,假设为nsub,然后在这些随机选择的nsub个样本特征中,选择一个??最优的特征来作为决策树的左右子树划分节点,这样进一步增强了模型的泛??化能力。??RF的算法过程总结如下:??15??
率表现来更新训练样本的权重,使得??第一个弱学习器学习误差率高的训练样本点的权重变高,便于在第二个弱学习器??中进行针对性优化,如此重复进行,直到达到事先给定的迭代次数T,最终将T个??弱学习器通过集合策略进行整合,得到最终的强学习器,如下图所示:??(>^Dl)?|带权市D1|?|弱学习器1??^?训练染??;?\??/?^?\??M个样本训職?卜学习叫强学二m??\:?!^?T^ri:??I:?ifl?/??厂?An?1?/??(u^)?^|DT?^?|弱学习器T??图3:?Boosting算法流程图??16??
【参考文献】:
期刊论文
[1]基于机器学习的神经精神疾病辅助诊断研究进展[J]. 雷炳业,潘嘉瑜,吴逢春,陆小兵,宁玉萍,陈军,吴凯. 中国医学物理学杂志. 2020(02)
[2]老年人肌少症的成因、评估及应对[J]. 王坤,罗炯,刘立,欧阳一毅. 中国组织工程研究. 2019(11)
[3]基于改进神经网络的糖尿病生化指标值预测[J]. 陈德华,洪灵涛,潘乔. 微型机与应用. 2017(05)
[4]武汉地区中老年男性肌肉减少症与骨密度的相关性[J]. 帅波,沈霖,杨艳萍,马陈,徐晓娟,吕林,夏雪. 中华骨质疏松和骨矿盐疾病杂志. 2016(03)
[5]维生素D在骨代谢异常治疗中的多效性[J]. 费锦萍,郭利明. 现代实用医学. 2015(12)
[6]北京高龄老年男性骨骼肌含量减少与行走功能的相关性研究[J]. 张颖,胡亦新,范利,张曼秀,孙静,韩晓琦,马晓娜,董宏艳,李梅. 中华保健医学杂志. 2014(06)
[7]采用不同标准对北京社区男性老年肌少症检出率比较的研究[J]. 李梅,胡亦新,董宏艳,张颖,范利,张曼秀,孙静,韩晓琦,刘云霞,马晓娜. 中华保健医学杂志. 2014(06)
[8]国际体力活动问卷中体力活动水平的计算方法[J]. 樊萌语,吕筠,何平平. 中华流行病学杂志. 2014 (08)
硕士论文
[1]社区居民糖尿病风险预测系统的设计与实现[D]. 苗丰顺.中国科学院大学(中国科学院沈阳计算技术研究所) 2019
[2]加权样本分类算法设计和基于加法逻辑回归模型的Boosting算法设计[D]. 王超.华中师范大学 2019
[3]老年2型糖尿病合并骨质疏松症与肌少症的相关性及影响因素的研究[D]. 肖娜.川北医学院 2019
[4]重庆市主城区中老年体检人群肌肉减少症患病率调查及危险因素分析[D]. 刘利利.重庆医科大学 2019
[5]基于BP神经网络的心血管病预测系统的研究与实现[D]. 李小敏.宁夏大学 2018
本文编号:3336467
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3336467.html