基于机器学习和非侵入特征的Ⅱ型糖尿病筛检研究
发布时间:2022-01-11 05:18
慢性疾病是人类生命健康的一大威胁。而在众多的慢性病中,糖尿病不仅损害了人们的身体健康,而且造成了沉重的经济和社会负担;而有效的早期筛检可以有效提高人类的生活质量,降低疾病负担,减少健康寿命损失年。然而,基于人群的大规模人口筛查不仅有较长的时间周期,而且会耗费巨额的人力物力。随着近年来机器学习的兴起与发展,越来越多的研究人员开始将机器学习模型作为筛检和预测的工具。为了提高人群的健康水平,在本研究中使用了人口学指标、身体测量指标、问卷调查、肠道微生物菌群作为非侵入的指标,来建立了糖尿病的筛检预测模型。本文分别选用了美国疾控中心(centers for disease control and prevention,CDC)的全国健康与营养调查(National Health and Nutrition Examination Survey,NHANES)和全人类微生物组计划(Integrative Human Microbiome Project,iHMP)中Ⅱ型糖尿病(type 2 diabetes mellitus,T2DM)的数据,来进行糖尿病的筛检与预测工作。首先,2011年到201...
【文章来源】:辽宁大学辽宁省 211工程院校
【文章页数】:47 页
【学位级别】:硕士
【部分图文】:
五折交叉验证下不同机器学习算法前50个集成模型性能使用上述选择出来的12个特征,共计算出6个不同模型,包括三种不同的机器学习模型及他们的聚类学习模型
第2章基于人体学指标的筛检模型17表2-5模型在测试集和外部验证集的性能表现AUC敏感性特异度准确率阳性预测值测试集LDA0.8640.6970.8290.8080.429RF0.8360.8300.6480.6760.303SVM0.7960.6300.8640.8270.460EELDA0.8670.7580.7770.7740.385EERF0.8500.7760.7700.7710.383EESVM0.8610.7520.7830.7780.390外部验证集LDA0.8460.7590.7620.7610.418RF0.8280.8880.5940.6480.331SVM0.8110.7200.7890.7760.435EELDA0.8490.8190.7090.7300.389EERF0.8360.8130.7130.7310.390EESVM0.8480.8240.7140.7340.394EE=简单聚类学习(easyensemble)图2-3外部验证集中三种机器学习及其聚类学习方法的ROC曲线A.LDA及其聚类学习ROC曲线B.RF及其聚类学习ROC曲线C.SVM及其聚类学习ROC曲线D.三种机器学习及其聚类学习ROC曲线
P = 0.210)。在外部验证集中,不同方法的简单聚类学习均在一定程度上提高了模型的性能,LDA 提高了 AUC 值的 0.004(Z = 2.734, P = 0.006)、RF 提高了AUC 值的 0.008(Z = 2.991, P = 0.002)、SVM 提高了 AUC 值的 0.037(Z = 5.908, P < 0.001)。 基于外部验证集的应用聚类学习方法模型性能的提高可以将此类模型应用与大规模人群的Ⅱ型糖尿病的筛查工作。为了更好的打成这一目的,我们建立了基于聚类学习的Ⅱ型糖尿病的预测网站(http://112.126.70.33/diabetes),该网站分别提供了用于个人和人群的Ⅱ型糖尿病筛检程序,对于个人使用者来说,给出了个人的患病概率;对于研究者来说,该网站会给出其中每个样本在 3 个不同机器学习模型及其聚类学习模型中的预测概率。图 2-4 给出了该网站的主页内容。
【参考文献】:
期刊论文
[1]基于机器学习算法的2型糖尿病患者3个月血糖预测[J]. 覃伟,高敏,沈莹,史宇晖,吴涛,赵艾,孙昕霙. 中华疾病控制杂志. 2019(11)
硕士论文
[1]汉族与蒙古族2型糖尿病相关肠道菌群差异分析[D]. 谢丹.中央民族大学 2019
[2]决策树模型在2型糖尿病诊断中的应用[D]. 马尔丽.沈阳师范大学 2018
本文编号:3582167
【文章来源】:辽宁大学辽宁省 211工程院校
【文章页数】:47 页
【学位级别】:硕士
【部分图文】:
五折交叉验证下不同机器学习算法前50个集成模型性能使用上述选择出来的12个特征,共计算出6个不同模型,包括三种不同的机器学习模型及他们的聚类学习模型
第2章基于人体学指标的筛检模型17表2-5模型在测试集和外部验证集的性能表现AUC敏感性特异度准确率阳性预测值测试集LDA0.8640.6970.8290.8080.429RF0.8360.8300.6480.6760.303SVM0.7960.6300.8640.8270.460EELDA0.8670.7580.7770.7740.385EERF0.8500.7760.7700.7710.383EESVM0.8610.7520.7830.7780.390外部验证集LDA0.8460.7590.7620.7610.418RF0.8280.8880.5940.6480.331SVM0.8110.7200.7890.7760.435EELDA0.8490.8190.7090.7300.389EERF0.8360.8130.7130.7310.390EESVM0.8480.8240.7140.7340.394EE=简单聚类学习(easyensemble)图2-3外部验证集中三种机器学习及其聚类学习方法的ROC曲线A.LDA及其聚类学习ROC曲线B.RF及其聚类学习ROC曲线C.SVM及其聚类学习ROC曲线D.三种机器学习及其聚类学习ROC曲线
P = 0.210)。在外部验证集中,不同方法的简单聚类学习均在一定程度上提高了模型的性能,LDA 提高了 AUC 值的 0.004(Z = 2.734, P = 0.006)、RF 提高了AUC 值的 0.008(Z = 2.991, P = 0.002)、SVM 提高了 AUC 值的 0.037(Z = 5.908, P < 0.001)。 基于外部验证集的应用聚类学习方法模型性能的提高可以将此类模型应用与大规模人群的Ⅱ型糖尿病的筛查工作。为了更好的打成这一目的,我们建立了基于聚类学习的Ⅱ型糖尿病的预测网站(http://112.126.70.33/diabetes),该网站分别提供了用于个人和人群的Ⅱ型糖尿病筛检程序,对于个人使用者来说,给出了个人的患病概率;对于研究者来说,该网站会给出其中每个样本在 3 个不同机器学习模型及其聚类学习模型中的预测概率。图 2-4 给出了该网站的主页内容。
【参考文献】:
期刊论文
[1]基于机器学习算法的2型糖尿病患者3个月血糖预测[J]. 覃伟,高敏,沈莹,史宇晖,吴涛,赵艾,孙昕霙. 中华疾病控制杂志. 2019(11)
硕士论文
[1]汉族与蒙古族2型糖尿病相关肠道菌群差异分析[D]. 谢丹.中央民族大学 2019
[2]决策树模型在2型糖尿病诊断中的应用[D]. 马尔丽.沈阳师范大学 2018
本文编号:3582167
本文链接:https://www.wllwen.com/yixuelunwen/nfm/3582167.html
最近更新
教材专著