基于电子病历分析的糖尿病患病风险数据挖掘方法研究
本文选题:空腹血糖 + 数据挖掘 ; 参考:《青岛大学》2016年硕士论文
【摘要】:空腹血糖(Fasting Blood Glucose,FBG)是衡量人体健康的一个重要指标。对空腹血糖的分析预测对发现和治疗疾病有重要意义,尤其是对糖尿病等相关疾病。体检数据是一种信息丰富的电子医疗数据,其中包含着大量体检者长期的健康指标。从大数据分析的角度,本文主要利用大数据方法研究了众多体检项与空腹血糖变化之间的关系,包含两方面的工作:首先,基于连续四年的历史体检数据和统的数据挖掘技术和经典算法,提出了对未来空腹血糖变化趋势预测的模型。该模型包括结合了随即森林特征重要性和顺序前向选择(Sequential Forward Selection,SFS)方法的特征选择算法,和对空腹血糖变化趋势概率化表示的算法。利用体检数据进行实验,表明进行特征选择后,得到与空腹血糖相关性较大体检项,并且模型的性能得到提升。对测试集上空腹血糖的趋势概率化表示,并选取空腹血糖变化高概率人群,从敏感度、特异度、正阳性预测值三方面进行分析,发现对于空腹血糖上升人群具有较好效果。其次,针对空腹血糖值表现正常群体,研究体检指标与空腹血糖高风险人群的关系建立空腹血糖上升风险预警模型。该模型考虑任两个体检项相互作用对于空腹血糖变化的影响,在数据集中添加了交叉项,通过重要体检项得分和特征选择,发现哪些体检项的相互作用对空腹血糖。从构造的交叉特征集合中,使用特征选择方式选取重要交叉项特征,用于构建空腹血糖上升风险预警模型。利用体检数据进行实验,结果表明随机森林模型在加入经过特征选择选取的交叉项,模型的性能得到提升,并对重要特征进行分析。由于数据集中存在严重的正负样本不平衡分类问题,本模型设计了基于欠抽样和模型组合的方法处理数据不平衡分类问题,取得了良好的效果。
[Abstract]:Fasting Blood Glucose (FBG) is an important indicator of human health. The analysis and prediction of fasting blood glucose is of great significance to the discovery and treatment of diseases, especially for diabetes and other diseases. Physical examination data is an informative electronic medical data, which includes a large number of long-term health indicators for a large number of medical examiners. In the perspective of large data analysis, this paper mainly uses large data method to study the relationship between many physical examination items and the change of fasting blood glucose. It includes two aspects: first, based on the historical physical examination data of four years and the data mining and classical algorithms, the model of predicting the trend of the change of fasting blood glucose in the future is put forward. The model includes the feature selection algorithm combined with the forthcoming forest feature importance and the sequential forward selection (Sequential Forward Selection, SFS) method, and the algorithm for the probability expression of the fasting blood glucose change trend. The performance of the type was improved. The trend of fasting blood glucose was expressed in the test set, and the high probability population of fasting blood glucose change was selected. From the sensitivity, specificity and positive positive predictive value three, it was found that it had a good effect on the population with ascending fasting blood glucose. Secondly, the normal group of fasting blood glucose was shown to study physical examination. The relationship between the index and the high risk population of fasting blood glucose was established to establish an early warning model for the risk of fasting blood glucose rise. The model considered the effect of the interaction of two physical examination items on fasting blood glucose change. In the cross feature set of the structure, the feature selection method is used to select the characteristics of the important cross item, which is used to construct the risk early warning model of the fasting blood glucose rise. The results show that the performance of the model is improved and the important characteristics are analyzed by adding the cross items selected by the feature selection. Because of the serious negative and negative sample classification problem in the data set, this model is designed to deal with the problem of disequilibrium classification of data based on the method of undersampling and model combination, and good results have been achieved.
【学位授予单位】:青岛大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:R587.1;TP311.13
【相似文献】
相关期刊论文 前10条
1 韦桂兰;;65例早餐后2小时血糖比空腹血糖偏低结果的分析[J];医药世界;2007年03期
2 蔡彩君;李再忠;翁志霞;;宁波市7620例企业退休人员空腹血糖调查分析[J];现代实用医学;2012年04期
3 ;测空腹血糖别晚于10点[J];大家健康;2010年05期
4 周志鹏;空腹血糖与餐后2小时血糖哪一个重要?[J];糖尿病新世界;2003年01期
5 邓晓初;空腹血糖超常103例临床特点的研究[J];中国全科医学;2003年12期
6 陈振浩 ,马伟明 ,陈笑腾 ,魏以宇;空腹血糖、瘦素、胰岛素样生长因子I的相关性探讨[J];放射免疫学杂志;2004年03期
7 隗金城,刘赫,赵聪,王洪明,吕丰;空腹血糖减损的流行病学调查[J];辽宁实用糖尿病杂志;2004年03期
8 沈雁萍,李剑平,李沂泽;儿童1型糖尿病空腹血糖高的治疗分析[J];医学理论与实践;2005年10期
9 刘运双,张丽萍,李凤华,杨平,高伟;10502例体检者空腹血糖分析[J];国外医学.临床生物化学与检验学分册;2005年03期
10 王兰;王文莲;童成莲;高继东;;2型糖尿病患者空腹血糖和餐后2小时血糖的临床意义[J];青海医学院学报;2007年02期
相关会议论文 前10条
1 张亚非;黄俭;周小兵;廖碧珠;吴凤兰;张明珠;冯雪莲;高晓梅;赵法;郭俊生;;1477例中老年人空腹血糖与相关指标的分析[A];达能营养中心青年科学工作者论坛优秀论文集2000年第6期[C];2000年
2 孙慧艳;沈飞霞;郑景晨;张文淼;;妊娠期糖尿病在妊娠不同时期的空腹血糖变化及意义[A];2008年浙江省内分泌学学术会议论文汇编[C];2008年
3 于明香;陈显英;高键;周俭;;肝移植术后5年内空腹血糖变化规律[A];2009中国医师协会内分泌代谢科医师分会年会论文汇编[C];2009年
4 陈园;韩刚;葛家璞;伊万;赵红丽;;新疆吐鲁番地区空腹血糖分析及相关因素的流行病学调查[A];中华医学会第十次全国内分泌学学术会议论文汇编[C];2011年
5 蔡彩君;李再忠;翁志霞;;宁波市7620例企业退休人员空腹血糖调查分析[A];2011年浙江省检验医学学术年会论文汇编[C];2011年
6 周旦阳;牟新;陈慧萍;刘颖慧;胡永宾;邹晓慧;寿成珉;陈家炜;任f ;周迪夷;;动态血糖监测评估2型糖尿病夜间低血糖与空腹血糖的相关性分析[A];中华医学会第十二次全国内分泌学学术会议论文汇编[C];2013年
7 王丽平;;空腹血糖在糖尿病筛查中的效果分析[A];第二十八届航天医学年会暨第十一届航天护理年会论文集[C];2012年
8 刘斌;王子莲;张颖;;孕早中期空腹血糖对妊娠期糖尿病的预测价值[A];中华医学会第十次全国妇产科学术会议产科会场(产科学组、妊高症学组)论文汇编[C];2012年
9 菅强;赵骥飞;吴业宾;贾保民;尹锴;田薇薇;;糖尿病患者空腹血糖与肾脏早期损害的相关性研究[A];中华医学会第七次全国中青年检验医学学术会议论文汇编[C];2012年
10 廖远泉;;皖南地区557例空腹血糖检测结果分析[A];中华医学会第九次全国检验医学学术会议暨中国医院协会临床检验管理专业委员会第六届全国临床检验实验室管理学术会议论文汇编[C];2011年
相关重要报纸文章 前10条
1 任昶;测空腹血糖不等于“忍饥挨饿”[N];健康时报;2007年
2 记者 吕诺;只查空腹血糖造成半数患者漏诊[N];新华每日电讯;2012年
3 金明;空腹血糖查什么[N];解放日报;2001年
4 魏妍平;测空腹血糖别晚于10点[N];健康时报;2007年
5 首都医科大学附属北京朝阳医院内分秘科 苗莉;测空腹血糖有两重意义[N];健康时报;2008年
6 浙江大学医学院附属第一医院内分泌科主任 李成江;只测空腹血糖易漏诊[N];健康时报;2008年
7 解放军305医院内分泌科 季雪飞;测空腹血糖:6~8点最准[N];健康时报;2007年
8 普陀区人民医院 童平;糖尿病诊断新标准[N];上海中医药报;2009年
9 健康时报特约记者 陈锦屏;晚餐高热量 清晨高血糖[N];健康时报;2007年
10 东南大学附属中大医院内分泌科 副主任医师 金晖;解读空腹血糖7.1mmol/L[N];家庭医生报;2009年
相关博士学位论文 前2条
1 刘凯;2型糖尿病膳食营养干预防治策略的研究[D];第三军医大学;2016年
2 岳峰;乙醇摄入与男性胰岛功能的相关性研究[D];山东大学;2012年
相关硕士学位论文 前10条
1 马辰星;空腹血糖筛查糖尿病截点的探讨与评价[D];河北联合大学;2014年
2 王强;无糖尿病病史患者空腹血糖、糖化血红蛋白水平与冠脉粥样硬化程度相关性研究[D];川北医学院;2015年
3 苗睿;简易OGTT对空腹血糖正常的冠心病患者的意义[D];河北医科大学;2015年
4 奚婷;糖尿病视网膜病变相关危险因素的研究[D];苏州大学;2015年
5 牛衍龙;运动治疗2型糖尿病患者个性化方案的研究[D];哈尔滨体育学院;2015年
6 马乾;化学治疗对肺癌患者空腹血糖和中医证型影响的研究[D];北京中医药大学;2016年
7 刘璐璐;血浆同型半胱氨酸与冠心病及其危险因素的相关性研究[D];吉林大学;2016年
8 梁函;皖西地区村民空腹血糖现况及基于村医的前糖尿病干预规程设计[D];安徽医科大学;2016年
9 刘航;空腹血糖与不稳定性心绞痛患者新发房颤的相关性探讨[D];山东大学;2016年
10 黄菲菲;一种长效的GLP-1受体激动剂CKJ151对db/db小鼠的降糖试验研究及对胰岛β细胞功能的影响[D];四川抗菌素工业研究所;2016年
,本文编号:1878398
本文链接:https://www.wllwen.com/yixuelunwen/nfm/1878398.html