基于机器学习的“三高”风险评估的研究与实现
本文选题:风险评估 + 三高 ; 参考:《北京邮电大学》2017年硕士论文
【摘要】:健康数据具有较高的价值,利用机器学习技术来挖掘健康数据中的信息能够为疾病预测、疾病风险评估、疾病诊断等带来新的思路。在某种意义上,机器学习在健康数据中的应用对于改善人类生活水平具有重要的作用。高血压、高血糖和高血脂及其并发症对人们的身体健康造成了严重的危害,我国“三高”的患病率正在逐年升高,目前已经成为了我国重要的公共卫生问题,有必要通过预防来降低其危害。但考虑到“三高”的发病机制较为复杂,很难通过临床来进行预测,因此有必要借助机器学习技术来挖掘“三高”健康数据中的信息。研究“三高”预测模型,进一步完成“三高”风险评估,实现“三高”的早预防、早治疗。总之,通过机器学习技术为“三高”风险评估提供科学依据,是本论文的研究目的和意义。论文研究工作主要围绕“三高”风险评估模型的设计,算法的选择,模型的改进和性能评估等方面展开。首先,结合哈佛癌症风险指数公式和Logistic回归模型提出了一个“三高”风险评估模型。然后,通过对“三高”肥胖相关数据的分析,研究肥胖相关的身体测量参数和“三高”之间的关系。最后,根据数据分析结果,结合决策树和Logistic回归算法提出了另一个“三高”风险评估模型,弥补了上一个模型的不足之处。通过对两个模型的性能进行比较,验证了后一个模型的可行性和性能的提升。论文最终通过实验验证了两个风险评估模型方案的可行性以及算法性能的提升。后一个模型和前一个模型相比,模型的准确率、特异度和灵敏度都获得了提升,尤其是女性高血糖风险评估模型的提升较为理想。本课题的研究成果对于“三高”的风险评估有一定的指导意义。
[Abstract]:Health data is of high value. Using machine learning technology to mine the information in health data can bring new ideas for disease prediction, disease risk assessment and disease diagnosis. In a sense, the application of machine learning in health data plays an important role in improving human living standards. Hypertension, hyperglycemia, hyperlipidemia and their complications have caused serious harm to people's physical health. The prevalence rate of "three high" in China is increasing year by year and has become an important public health problem in our country. It is necessary to reduce its harm by prevention. However, it is difficult to predict the pathogenesis of the "three high" because of its complexity, so it is necessary to mine the information in the "three high" health data by means of machine learning technology. The prediction model of "three high" is studied, and the risk assessment of "three high" is further completed, and the early prevention and treatment of "three high" are realized. In a word, the purpose and significance of this paper is to provide scientific basis for the risk assessment of "three High" by machine learning technology. This paper mainly focuses on the design of the "three High" risk assessment model, the selection of algorithm, the improvement of the model and the performance evaluation. Firstly, combining the Harvard cancer risk index formula and the Logistic regression model, a "three high" risk assessment model is proposed. Then, through the analysis of the obesity data, the relationship between the obesity related body measurement parameters and the three high levels was studied. Finally, according to the data analysis results, combined with the decision tree and Logistic regression algorithm, another "three high" risk assessment model is proposed, which makes up for the shortcomings of the previous model. By comparing the performance of the two models, the feasibility and performance improvement of the latter model are verified. Finally, the paper verifies the feasibility of the two risk assessment models and the performance improvement of the algorithm. Compared with the previous model, the accuracy, specificity and sensitivity of the latter model were improved, especially in the female hyperglycemia risk assessment model. The research results of this paper have certain guiding significance for the risk assessment of the "three High".
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:R318;TP181
【相似文献】
相关期刊论文 前10条
1 马国庆;李伟;;电力企业信息安全风险评估模型研究[J];价值工程;2008年08期
2 刘闽,林成德;基于支持向量机的商业银行信用风险评估模型[J];厦门大学学报(自然科学版);2005年01期
3 张振国;温家洪;李雪丽;;面向社区的参与式灾害风险评估模型研究[J];灾害学;2013年03期
4 王晓红;王凌燕;;煤炭企业的投资风险评估模型[J];商场现代化;2012年02期
5 顾远;;违约风险评估模型及其实证研究[J];安徽工业大学学报(社会科学版);2006年06期
6 胡金东;黄文锋;;中小企业柔性风险评估模型研究——基于某担保机构的实践经验[J];科技进步与对策;2010年07期
7 佘玉梅;一种协调机器学习方法研究[J];云南民族学院学报(自然科学版);2000年03期
8 王珏,石纯一;机器学习研究[J];广西师范大学学报(自然科学版);2003年02期
9 张震;李军利;;机器学习方法及其在生物信息学中的应用[J];吉首大学学报(自然科学版);2006年04期
10 许程;;机器学习的主要策略与基本结构[J];科技资讯;2010年03期
相关会议论文 前10条
1 海然;谢小权;;基于多要素融合的风险评估模型的设计[A];全国计算机安全学术交流会论文集(第二十二卷)[C];2007年
2 薛晔;黄崇福;;自然灾害风险评估模型的研究进展[A];中国灾害防御协会风险分析专业委员会第二届年会论文集(二)[C];2006年
3 王珏;;归纳机器学习[A];2001年中国智能自动化会议论文集(上册)[C];2001年
4 王昊;李银波;纪志梁;;利用机器学习方法预测严重药物不良反应-呼吸困难[A];中国化学会第28届学术年会第13分会场摘要集[C];2012年
5 吴沧浦;;智能系统与机器学习的新领域[A];西部大开发 科教先行与可持续发展——中国科协2000年学术年会文集[C];2000年
6 周晴杰;徐立鸿;吴启迪;;机器学习串级结构的初步探讨[A];1998年中国控制会议论文集[C];1998年
7 李刚;郭崇慧;林鸿飞;杨志豪;唐焕文;;基于词典法和机器学习法相结合的蛋白质名识别[A];大连理工大学生物医学工程学术论文集(第2卷)[C];2005年
8 徐礼胜;李乃民;王宽全;张冬雨;耿斌;姜晓睿;陈超海;罗贵存;;机器学习在中医计算机诊断识别系统中的应用思考[A];第一届全国中西医结合诊断学术会议论文选集[C];2006年
9 蔡健平;林世平;;基于机器学习的词语和句子极性分析[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
10 黄金铁;李景银;周建常;;对高炉炉况评价模型参数的机器学习——一个三类线性模式分类器的实现[A];1995中国控制与决策学术年会论文集[C];1995年
相关重要报纸文章 前10条
1 黎骊/文 [美] Tom M.Mitchell 著;机器学习与智能化社会[N];中国邮政报;2003年
2 IBM大数据专家 James Kobielus 范范 编译;机器学习已成为大数据基石[N];网络世界;2014年
3 本报记者 房琳琳;合久必分:分布式“机器学习”应运而生[N];科技日报;2014年
4 雨辰;机器学习类图书为什么火爆[N];中华读书报;2014年
5 百度公司技术副总监 多媒体部负责人 余凯;深度学习与多媒体搜索技术演进[N];中国信息化周报;2013年
6 本报记者 余建斌;机器学习与互联网搜索[N];人民日报;2011年
7 本报记者 张晔邋通讯员 李玮;周志华:永不墨守成规[N];科技日报;2008年
8 赵晓涛;从灾难中寻找安全[N];网络世界;2007年
9 安菁菁;滨海新区金融机构应重视信用风险管理[N];中国会计报;2010年
10 招商证券衍生投资部负责人 刘成彦;场外金融衍生品风险的类别及对策建议[N];证券时报;2013年
相关博士学位论文 前10条
1 戴明;长三角地区船联网信息感知与交互关键技术研究[D];长安大学;2016年
2 张万军;基于大数据的个人信用风险评估模型研究[D];对外经济贸易大学;2016年
3 董春茹;机器学习中的权重学习与差分演化[D];华南理工大学;2015年
4 姚明臣;机器学习和神经网络学习中的若干问题研究[D];大连理工大学;2016年
5 Maxim Pecionchin;[D];对外经济贸易大学;2016年
6 杜宇;基于深度机器学习的体态与手势感知计算关键技术研究[D];浙江大学;2017年
7 钟锦红;群智学习若干问题研究[D];中国科学技术大学;2017年
8 赵东;基于群智能优化的机器学习方法研究及应用[D];吉林大学;2017年
9 鲁路;基于机器学习优化分子对接筛选肾衰营养胶囊有效成分[D];南方医科大学;2017年
10 赵玉鹏;机器学习的哲学探索[D];大连理工大学;2010年
相关硕士学位论文 前10条
1 李玲;基于机器学习的“三高”风险评估的研究与实现[D];北京邮电大学;2017年
2 陈蓬来;面向农村的两阶段多肿瘤风险评估模型前期研究[D];安徽医科大学;2015年
3 申振华;中小企业信用风险评估模型研究[D];苏州大学;2015年
4 崔釜萍;住院患者静脉血栓栓塞危险因素的相关分析[D];华北理工大学;2015年
5 刘思帆;一种基于主机日志分析的实时风险评估模型的研究与实现[D];复旦大学;2014年
6 李美莲;基于信息服务保障行驶安全的主动控制策略研究[D];西安电子科技大学;2014年
7 徐笑蕊;面向数字版权管理系统的风险评估模型研究与应用[D];东华大学;2016年
8 刘烁;物流业专职驾驶员健康风险评估体系研究[D];山东财经大学;2016年
9 雷霞飞;基于行业风险系数的科技型中小企业风险评估模型的研究与实现[D];吉林大学;2016年
10 杨梦;我国上市公司信用风险评估模型比较及实证研究[D];西南交通大学;2015年
,本文编号:1887803
本文链接:https://www.wllwen.com/yixuelunwen/swyx/1887803.html