三种机器学习方法在冠心病筛查中的比较研究
本文关键词:三种机器学习方法在冠心病筛查中的比较研究,,由笔耕文化传播整理发布。
【摘要】:目的:针对慢性病调查数据,建立RBF-DDA神经网络、支持向量机、随机森林三种冠心病识别模型,探索不同机器学习方法在冠心病筛查识别中的应用,验证多种机器学习方法在冠心病筛查中应用的可能性,为冠心病筛查方法的改进提供支持。方法:将2012年开展的吉林省成人慢性病及其危险因素调查的数据划分为训练数据集和测试数据集。首先利用训练数据集建立RBF-DDA神经网络模型、支持向量机模型和随机森林模型的冠心病筛查识别模型,利用测试数据集的输入变量输入已经建立好的模型,预测识别输出变量,并与测试数据集中的实际输出变量进行对比,产生模型的识别效果。然后通过手工、十折交叉验证等方式对不同模型中涉及的参数进行优化。最后,利用最优参数建立三种模型,对模型的筛查识别效果进行检验,并通过精度、灵敏度、特异度等指标对不同模型的筛查识别效果进行比较。结果:1.RBF-DDA神经网络取得的最优参数为:激活阈值(0.5)和抑制阈值(0.5)。将RBF-DDA神经网络模型在测试集中的是否患冠心病预测值与实际值进行比较,模型的精度55.83%、灵敏度58.88%、特异度55.46%、G-Mean57.14%。RBF-DDA神经网络模型的结果优于传统RBF神经网络。2.支持向量机有四种不同的核函数,不同核函数建立四种支持向量机模型:linear-SVM、radial-SVM、sigmoid-SVM、polynomial-SVM。linear-SVM模型的最优参数为,cost=0.5;radial-SVM模型的最优参数为,cost=2、gamma=0.01;sigmoidSVM模型的最优参数为,cost=4、gamma=0.001、coef0=0.25;polynomial-SVM模型的最优参数为,cost=8、gamma=0.001、coef0=0.25、degree=3。经过参数优化后,得到四种模型的最优识别效果。linear-SVM模型的精度68.03%、灵敏度76.45%、特异度67.01%、G-Mean71.57%。radial-SVM模型的精度65.32%、灵敏度77.57%、特异度63.84%、G-Mean70.37%。sigmoid-SVM模型的精度67.93%、灵敏度77.94%、特异度66.71%、G-Mean72.11%。polynomial-SVM模型的精度67.58%、灵敏度79.07%、特异度66.19%、G-Mean72.34%。3.随机森林模型采用手工和十折交叉验证两种参数优化方式。手工参数优化取得的最优参数为:mtry=6、ntree=300。十折交叉验证参数优化取得的最优参数为:mtry=6、ntree=290。手工优化的随机森林模型的精度66.86%、灵敏度81.50%、特异度65.08%、G-Mean72.83%。十折交叉验证优化的随机森林模型的精度66.49%、灵敏度80.56%、特异度64.79%、G-Mean72.24%。4.三种模型识别效果的比较,随机森林的综合效果最好,模型的精度66.86%、灵敏度81.50%、特异度65.08%、G-Mean72.83%。在精度和特异度上,随机森林与支持向量机相差不大,且均比RBF-DDA神经网络模型要好。在灵敏度上,随机森林最好,比支持向量机高2.43%,比RBF-DDA神经网络高22.62%。在综合指标G-Mean上,随机森林比支持向量机高0.49%,比RBF-DDA神经网络高15.69%。结论:1.RBF-DDA神经网络、支持向量机和随机森林三种模型在基于慢性病调查资料的冠心病识别运用中具有可行性。2.针对模型参数的优化,对RBF-DDA神经网络、支持向量机和随机森林三个模型的冠心病识别效果均有提升。3.三个模型的识别效果:随机森林模型最好、支持向量机其次、RBFDDA神经网络最差。
【关键词】:冠心病 RBF-DDA神经网络 支持向量机 随机森林 慢性病筛查
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:R541.4
【目录】:
- 中文摘要4-6
- Abstract6-11
- 第1章 前言11-24
- 1.1 研究背景11
- 1.2 国内外研究现状11-13
- 1.3 RBF-DDA神经网络13-18
- 1.3.1 RBF-DDA神经网络原理13-17
- 1.3.2 RBF-DDA神经网络应用17-18
- 1.4 支持向量机18-20
- 1.4.1 支持向量机原理18-19
- 1.4.2 支持向量机应用19-20
- 1.5 随机森林20-22
- 1.5.1 随机森林原理20-21
- 1.5.2 随机森林应用21-22
- 1.6 立题依据22-24
- 第2章 资料与方法24-27
- 2.1 研究资料24-25
- 2.2 研究方法25
- 2.3 质量控制25-26
- 2.4 统计分析方法26-27
- 第3章 结果27-48
- 3.1 研究资料的基本情况27
- 3.2 RBF-DDA神经网络模型27-31
- 3.2.1 构建训练数据集和测试数据集28
- 3.2.2 数据预处理28-29
- 3.2.3 模型参数设置29-31
- 3.2.4 RBF-DDA神经网络最优模型筛查识别效果31
- 3.3 支持向量机模型31-41
- 3.3.1 构建训练数据集和测试数据集32
- 3.3.2 支持向量机核函数32-33
- 3.3.3 模型参数设置33-39
- 3.3.4 不同核函数支持向量机模型识别效果39-41
- 3.4 随机森林模型41-45
- 3.4.1 构建训练数据集和测试数据集42
- 3.4.2 建模步骤42
- 3.4.3 随机森林模型参数优化42-44
- 3.4.4 随机森林模型识别效果44-45
- 3.5 三种模型的比较45-48
- 3.5.1 三种模型数据预处理的比较45
- 3.5.2 三种模型建立过程的比较45-46
- 3.5.3 三种模型识别效果的比较46-48
- 第4章 讨论48-56
- 4.1 冠心病慢性病调查资料特征48-49
- 4.2 RBF-DDA神经网络模型49-51
- 4.3 支持向量机模型51-52
- 4.4 随机森林模型52-54
- 4.5 三种模型的比较54
- 4.6 研究亮点54-56
- 第5章 结论56-57
- 参考文献57-67
- 作者简介及科研成果67-68
- 致谢68
【相似文献】
中国期刊全文数据库 前10条
1 康爱梅;冠心病人的饮食标准[J];四川农业科技;2001年01期
2 彭迳英,关月嫦;老年冠心病患者出院前的健康教育[J];心血管康复医学杂志;2001年03期
3 余国膺;一种简易、有效、经济识别冠心病人的方法[J];中国慢性病预防与控制;2001年02期
4 徐岷 ,王玉萍;氧化低密度脂蛋白自身抗体与冠心病相关性研究[J];临床医学;2003年07期
5 朱金富,杨德森,肖水源;冠心病的心理干预现状[J];国外医学.精神病学分册;2003年04期
6 王丽娜,李桂英;老年冠心病患者的出院护理指导[J];实用心脑肺血管病杂志;2003年05期
7 史振涛,艾永珍,刘月光;介入检查及治疗54例冠心病的护理体会[J];中国冶金工业医学杂志;2003年02期
8 王萍,王红,王朝容;冠心病的护理[J];现代医药卫生;2004年16期
9 洪昭光;冠心病人 谨防猝死[J];中华老年多器官疾病杂志;2005年02期
10 张瑞敏,杨清;不同类型冠心病患者的健康教育[J];时珍国医国药;2005年11期
中国重要会议论文全文数据库 前10条
1 李培红;禹水福;马煜;;离退休冠心病患者实施健康教育体会[A];河南省外科护理新业务、新技术学术交流会议资料汇编[C];2005年
2 李颖;;老年冠心病患者健康教育的体会[A];河南省内科护理学术交流暨糖尿病护理新进展培训班资料汇编[C];2006年
3 闫丽;;中青年冠心病人护理[A];中华护理学会全国内科护理学术交流暨专题讲座会议论文汇编[C];2009年
4 涂哲明;韩刚亚;张新风;黄琼;刘波;;心理因素对冠心病影响的研究进展[A];全国第十一次精神卫生高级论坛论文汇编[C];2011年
5 吕国良;;医疗体育对中老年冠心病人的康复及预后研究[A];全国冠心病防治及对策研讨会论文集[C];1987年
6 傅绍萱;;烟酒与冠心病预防[A];全国冠心病防治及对策研讨会论文集[C];1987年
7 张伯源;岳冬梅;黎天桂;;冠心病人在持续刺激和紧张作业后的心理生理反应恢复过程的特点[A];全国冠心病防治及对策研讨会论文集[C];1987年
8 贾振惠;;冠心病患者的院外康复指导[A];全国心脏内、外科专科护理学术会议论文汇编[C];2003年
9 王庆顺;田丰;刘永庆;杨丽华;胡秀琴;苏展;王蒙丽;许波;周玉珍;;冠心病的介入治疗[A];2003年内蒙古自治区自然科学学术年会优秀论文集[C];2003年
10 黄玉荣;谢宝珍;;108例冠心病患者的护理观察[A];全国心脏内外科专科护理学术交流暨专题讲座会议论文汇编[C];2004年
中国重要报纸全文数据库 前10条
1 韩咏霞;5招助冠心病人过好春节[N];中国中医药报;2007年
2 晓川;冠心病人精打细算过一天[N];保健时报;2003年
3 邱吉芬;冠心病人过冬六注意[N];云南科技报;2001年
4 羊剑;冠心病人要注意保健[N];重庆日报;2000年
5 佳楣;冠心病人的冬季保健[N];中国消费者报;2000年
6 邱吉芬;冠心病人如何安全过冬[N];大众卫生报;2007年
7 陈燕琳;冠心病人莫忘调心[N];家庭医生报;2007年
8 指导专家 北京大学人民医院心血管内科主任医师 严晓伟 重庆市中山医院心血管内科副主任医师 郑向清 特约记者 张小平 记者 胡长飞;冠心病约四成“诊断错误”[N];医药导报;2007年
9 俊芳;为什么“急性人”易患冠心病[N];上海中医药报;2008年
10 方芳;冠心病人腹泻要小心心梗[N];医药养生保健报;2008年
中国博士学位论文全文数据库 前10条
1 赵红;唐山地区醛固酮合成酶基因CYP11B2-344T/C多态性与冠心病关系[D];天津医科大学;2015年
2 杨进华;ST2基因多态性与冠心病严重程度的相关性分析[D];华中科技大学;2015年
3 方建群;D型人格—冠心病不良预后模型的实证研究[D];中南大学;2008年
4 周莉;中国汉族人群血脂水平及冠心病的遗传易感性研究[D];华中科技大学;2011年
5 耿婕;老年冠心病患者血脂代谢特点分析[D];天津医科大学;2011年
6 潘晓平;队列人群冠心病、脑卒中死亡的统计分析方法探讨[D];四川大学;2004年
7 王s
本文编号:286777
本文链接:https://www.wllwen.com/yixuelunwen/xxg/286777.html