当前位置:主页 > 医学论文 > 内分泌论文 >

基于数据挖掘的糖尿病预测模型研究

发布时间:2022-02-23 00:33
  糖尿病(Diabetes Mellitus,DM)是一种以高血糖为特征的慢性疾病,且具有明显的家族遗传特性。国际糖尿病联盟在Diabetes Atlas(Eighth Edition)中预测到21世纪中期全世界范围内的糖尿病患者数量会超过6亿人,这个数量将超过全世界总人口数的十分之一。在中国过去三十多年的社会发展历史中,人们开始意识到这一普遍影响家庭生活和个人幸福的慢性疾病所带来的影响。当前,从健康数据中获取有价值的信息正在逐渐成为一种趋势。互联网及信息技术的快速发展使得大量有关个人健康的信息数据得以沉淀,但是庞大的数据量始终缺乏有效的整理、规范及利用。通过有效方法将所有可用信息智能地转化为有价值的知识,比以往任何时候都更加重要和必不可少。如何挖掘出数据中有意义的信息为糖尿病的预防提供合理的建议成为当前亟待解决的问题。基于数据挖掘的分析能够对事物的发展趋势做出预测也能够发现数据中包含的特征因素,针对糖尿病健康数据进行数据挖掘的研究分析有希望成为糖尿病预防的有效解决方案。本论文结合现有糖尿病预测模型的研究基础,针对多个有价值的糖尿病健康数据集进行数据挖掘实验,提出一种预测效果更佳、适用性... 

【文章来源】:北京工业大学北京市211工程院校

【文章页数】:73 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
        1.2.1 国外研究现状
        1.2.2 国内研究现状
    1.3 论文主要研究内容
        1.3.1 利用数据预处理技术对数据集进行处理
        1.3.2 使用数据挖掘算法建立糖尿病预测模型
        1.3.3 提取糖尿病患者再入院的潜在风险因素
    1.4 论文组织结构安排
第2章 糖尿病数据挖掘相关方法
    2.1 糖尿病详解
        2.1.1 1型糖尿病
        2.1.2 2型糖尿病
        2.1.3 妊娠期糖尿病
    2.2 数据挖掘在糖尿病方面的应用
        2.2.1 数据挖掘的过程
        2.2.2 基于分类算法的应用
        2.2.3 基于聚类算法的应用
        2.2.4 基于关联算法的应用
    2.3 典型算法应用
        2.3.1 K-means算法
        2.3.2 Logistic回归算法
        2.3.3 决策树算法
        2.3.4 随机森林算法
        2.3.5 遗传算法
    2.4 本章小结
第3章 糖尿病预测研究实验数据准备
    3.1 实验环境搭建
        3.1.1 WEKA工具平台
        3.1.2 Matlab实验平台
    3.2 糖尿病数据集
        3.2.1 Pima Indian Diabetes数据集
        3.2.2 Dr. Schorling提供的数据集
        3.2.3 调查问卷收集的数据集
        3.2.4 Diabetes 130-US hospitals for years 1999-2008数据集
    3.3 数据集预处理
        3.3.1 实验相关数据预处理技术
        3.3.2 糖尿病预测研究实验数据预处理
        3.3.3 糖尿病再入院风险特征实验数据预处理
    3.4 本章小结
第4章 糖尿病预测研究实验算法模型建立
    4.1 实验算法特点
        4.1.1 K-means算法特点
        4.1.2 Logistic回归算法特点
        4.1.3 决策树算法特点
        4.1.4 随机森林算法特点
    4.2 K-means与决策树组合算法模型
        4.2.1 预测模型步骤
        4.2.2 预测模型算法应用
    4.3 改进的K-means与Logistic回归组合算法模型
        4.3.1 预测模型步骤
        4.3.2 预测模型算法应用
    4.4 本章小结
第5章 糖尿病预测研究实验结果分析
    5.1 糖尿病预测研究实验结果
        5.1.1 Kappa统计量
        5.1.2 准确性、敏感性、特异性
        5.1.3 分类细节准确率
    5.2 糖尿病预测研究现有模型验证
    5.3 糖尿病预测研究新数据集验证
        5.3.1 Dr. Schorling提供的数据集验证
        5.3.2 调查问卷收集的数据集验证
    5.4 糖尿病患者再入院风险特征实验分析
        5.4.1 实验内容
        5.4.2 实验结果
    5.5 本章小结
第6章 糖尿病预测研究实验可靠性论证
    6.1 实验结果准确性论证
        6.1.1 相关研究者实验结果对比
        6.1.2 10折交叉验证
    6.2 组合算法模型有效性论证
    6.3 本章小结
结论
参考文献
攻读硕士期间取得的研究成果
致谢


【参考文献】:
期刊论文
[1]基于深度学习模型在2型糖尿病患病风险预测中的应用[J]. 王喜丹,王晓丹,梁丽.  临床医药文献电子杂志. 2017(84)
[2]基于频繁模式增长算法的2型糖尿病患病风险预测的分析研究[J]. 韦哲,叶广健,王能才.  中国医学装备. 2016(05)
[3]2型糖尿病报告发病率研究进展[J]. 汪会琴,胡如英,武海滨,俞敏.  浙江预防医学. 2016(01)
[4]具有容噪特性的C4.5算法改进[J]. 王伟,李磊,张志鸿.  计算机科学. 2015(12)
[5]一种改进的C4.5决策树算法[J]. 胡美春,田大钢.  软件导刊. 2015(07)
[6]医疗健康大数据:应用实例与系统分析[J]. 董诚,林立,金海,廖小飞.  大数据. 2015(02)
[7]中国糖尿病的流行病学现状及展望[J]. 廖涌.  重庆医科大学学报. 2015(07)
[8]C4.5算法的改进及应用[J]. 佘为.  信息与电脑(理论版). 2015(12)
[9]医疗健康大数据研究综述[J]. 颜延,秦兴彬,樊建平,王磊.  科研信息化技术与应用. 2014(06)
[10]人工神经网络模型在2型糖尿病患病风险预测中的应用[J]. 郭奕瑞,李玉倩,王高帅,刘晓田,张路宁,张红艳,王炳源,王重建.  郑州大学学报(医学版). 2014(02)

博士论文
[1]中国成人个体糖尿病发病风险预测模型的建立及验证[D]. 米生权.中国疾病预防控制中心 2011

硕士论文
[1]糖尿病健康数据分析方法及应用[D]. 王瑶.哈尔滨工业大学 2017
[2]基于电子病历分析的糖尿病患病风险数据挖掘方法研究[D]. 肖文翔.青岛大学 2016
[3]基于机器学习算法的糖尿病预测模型研究[D]. 洪烨.哈尔滨工业大学 2016
[4]基于weka的可视化医疗数据挖掘平台的设计与实现[D]. 刘斌.湖南大学 2016
[5]基于数据挖掘技术的糖尿病临床数据分析[D]. 何禹德.长春工业大学 2016
[6]改进遗传算法在营养配餐系统中的应用[D]. 刘宏畅.北京工业大学 2015



本文编号:3640503

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/nfm/3640503.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ce4cc***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com