当前位置:主页 > 医学论文 > 内分泌论文 >

医学信息学在糖尿病中的数据分析与算法设计

发布时间:2020-01-17 13:17
【摘要】:在中国人群传统生活方式的改变和社会的快速转型导致易胖环境的出现,而易胖环境的出现已经给许多人带来了较高的2型糖尿病患病风险,特别是年轻人、老年人和处于社会底层的人士,由于特殊的生活方式和生活压力,他们面临着更大的风险。专家表示,2型糖尿病与现代的生活方式、不健康的饮食习惯、运动量的减少以及肥胖有很大的关系。大多数的2型糖尿病患者在糖尿病的早期阶段没有明显症状,2型糖尿病约有9~12年的隐匿期,很多患者可能得病多年却无法被诊断,我国国民中存在着许多未确诊的隐匿糖尿病患者。因此,医学和社会学工作者要加强对易患糖尿病的高危人群的深入研究,降低糖尿病发病率的重点是对易患糖尿病的高危人群进行筛查和预防。本课题采用了拥有16个有效变量的403个真实医疗数据。首先使用R studio对数据进行分析,利用散点图、直方图等将数据可视化,然后计算各变量与糖化血红蛋白和糖尿病之间的相关系数,采用T检验和卡方检验等对相关系数进行假设检验,最终得到影响糖尿病的6个重要变量:胆固醇含量、血糖含量、胆固醇和高密度脂蛋白之比、高密度脂蛋白、年龄和腰围。接下来拟合糖化血红蛋白含量和糖尿病的回归模型,利用该回归模型进行预测,正确率为92.8%,敏感度为93.67%,特异度为86.05%。下一步在R语言中调用支持向量机包,使用10折交叉验证寻找最优参数,使用这两个最优参数构建SVM模型,对数据进行预测的正确率达到97.67%,敏感度为100%,特异度为81.82%。最后,选择C#语言结合ASP.NET技术设计了一个简单的糖尿病风险测评系统,用户输入自己的身体指标,系统对输入的数据进行分析,返回用户患糖尿病的概率和异常的指标,将易患糖尿病的高危人群筛选出来。通过该糖尿病风险预测模型,能够方便的筛查出易患糖尿病的高危人群,用户能够利用该工具简单方便的进行自我测试,随时随地监测自己的身体指标变化,为糖尿病的预防以及检测提供了一个实用有效的工具。针对尚无明显症状的人群进行筛查,有利于普及健康知识教育,提高公众对糖尿病的关注,预测糖尿病的发病风险,筛查出极易患糖尿病的人群,提高糖尿病的检出率,实现对糖尿病高危人群早发现、早诊断、早治疗的目标。对筛查出的糖尿病患者应实施及时精确的治疗和干预措施,能够大大延缓糖尿病和糖尿病前期的发病进程,降低糖尿病及其并发症的发病率,提高其生存质量。
【图文】:

回归模型,公式,可能性,待估参数


图 2.1 Logistic 函数的“S”形曲线们用 X 代表自变量,P 代表患糖尿病的概率,则 P 与 X 之间的关系如公式 1expXβexpXβPP(y1|X) 公式(2.2)作 Logic 变换,得到公式(2.3):Xβ1-PPlogic(y) ln 式称为 Logistic 回归模型,其中 为待估参数。gistic 回归模型经常被应用在流行病学中,一般用于分析影响某种疾病的以此作为根据预测患该种疾病的可能性。Logistic 回归的主要用途有以下找对某一疾病的发生有影响的因素;(2)根据模型,预测在危险因素不病的可能性;(3)根据模型,判断患者属于该种疾病的概率。回归系数的假设检验

分布图,原始数据,缺失数据,缺失


图 3.2 原始数据的缺失值分布通过缺失数据的分布图可知:有 375 个完整样本点;血糖含量、地区、性别、缺失数据;胆固醇含量、高密度脂蛋白、体重各有 1 个缺失数据,且查看原始,缺失的胆固醇含量和高密度脂蛋白属于同一元组,因此胆固醇与高密度脂蛋有 1 个缺失数据;腰围、臀围各有 2 个缺失数据;实验数据采集时间有 3 个缺身高、首次测量收缩期血压和首次测量舒张期血压各有 5 个缺失数据;体型失数据;糖化血红蛋白含量有 13 个缺失数据;数据集总共包含了 39 个缺失一行给出了每个变量中缺失数据的个数。我们还可以利用 VIM 包中的 aggr 函数可视化数据集中的缺失数据,,绘制缺失布图,从缺失数据分布图中可以看出糖化血红蛋白含量一列数据的缺失比例了 3%;其次就是体型,其缺失比例大约为 2.9%;身高、首次测量收缩期血压量舒张期血压 3 列的数据缺失比例为 1.2%,其他列的数据缺失比例都较小,9本无缺失数据。如图 3.3 所示。
【学位授予单位】:济南大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:R-05;R587.1

【参考文献】

相关期刊论文 前10条

1 董春蓉;;多层面健康教育与护理干预模式在糖尿病患者护理管理中的作用[J];中国卫生产业;2016年32期

2 黄福英;何德英;;慢性非传染性疾病与健康管理[J];世界最新医学信息文摘;2016年80期

3 左银花;夏杰;李启强;余道兵;;糖尿病预测模型用于筛选糖尿病高危人群的价值探讨[J];数理医药学杂志;2016年07期

4 杨贵军;李静华;;基于PMM多重插补法的线性模型系数估计量的模拟研究[J];数量经济技术经济研究;2014年10期

5 杨洪涛;姜晨;;糖尿病肾病心脑血管并发症的诊断与中西医结合治疗[J];中华肾病研究电子杂志;2013年04期

6 李璐;;基于R语言的缺失值填补方法[J];统计与决策;2012年17期

7 曾文林;;中医药治疗糖尿病及其并发症的研究[J];湖北中医杂志;2012年08期

8 郭岩松;;《中国慢性病防治工作规划(2012-2015年)》印发[J];中国医药导刊;2012年07期

9 赵瑜飞;王维科;;张素清教授中西医结合辨治糖尿病[J];内蒙古中医药;2012年03期

10 曹艳丽;单忠艳;;糖尿病的诊断标准:OGTT vs HbA_(1C)[J];药品评价;2011年01期



本文编号:2570625

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/nfm/2570625.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户26a35***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com