基于数据挖掘的缺血性脑卒中风险预测模型及其应用研究
发布时间:2021-01-26 17:19
脑卒中,具有“四高一多”等特征以及发病人群年轻化趋势,不可逆转,严重威胁着人类的生命和健康。其中,缺血性脑卒中占卒中总人数的60%-70%。因此,提前筛查缺血性脑卒中高危个体至关重要。本文基于数据挖掘分类算法及其评估等相关理论,构建缺血性脑卒中风险预测模型,筛查高危人群,并进行健康管理。首先,通过合作医院获取样本,利用相关的数据处理技术对收集的样本数据进行预处理,同时采用Logistic回归算法精简缺血性脑卒中风险预测的指标集。其次,为提升模型的可操作性与实用性,在精简的指标集上分别从简单个人水平与复杂临床水平建立不同水平的缺血性脑卒中风险预测模型,以筛查不同水平脑卒中高危人群。第三,为规避单一分类器的局限性,本文综合比较多个分类器(决策树和支持向量机)的优劣,同时运用多种模型评估方法对已构建的缺血性脑卒中风险预测模型的性能进行评价。最后,为了实现脑卒中高危人群筛查的高精度、高准确率的要求,本文采用网格搜索算法分别优化支持向量机算法与集成决策树的随机森林算法,并将优化的算法与单一算法进行对比,最终寻求建立各方面最佳的风险预测模型。同时将预测模型应用于缺血性脑卒中健康管理系统中。本文构建...
【文章来源】:燕山大学河北省
【文章页数】:92 页
【学位级别】:硕士
【部分图文】:
技术路线图
第2章相关理论基础-13-(2)健康评估:健康评估是推动健康管理的专业技术,它根据采集的健康信息,确定个体或群体现处于的健康状态,同时通过数学或计算机等方式构建疾病患病风险预测模型,对个人或群体的患病风险进行预测。(3)健康分析:在健康评估的基础上,对预测结果进行分析,找出可干预的危险因素,帮助个人全面认识自我健康风险并制定健康管理计划。(4)健康干预:健康管理循环的最终目标,它是在之前步骤的基础下,根据制定的健康管理个性化服务方案纠正不良生活作息。疾病发病的危险因素日趋复杂,要调节我国增长的健康需求与短缺的医疗资源之间的平衡,最高效的方法就是进行科学的健康管理。目前,健康管理的方法如图2-1所示,方法1表明通过医疗干预可以减弱危险因素对健康的影响[47];方法2与方法3表明,通过健康管理可以调节危险因素对健康的影响[48];方法4为医疗干预对健康管理的反溃通过图2-1可以发现,健康管理在危险因素与医疗干预之间起到调控与缓冲作用。一方面,通过健康管理达到疾病预防或者早发现、早诊断、早治疗,从而减少医疗资源的需求;另一方面,可以优化医疗资源配置,实现效益最大。图2-1健康管理与危险因素、医疗干预之间的关系2.2数据挖掘及其算法概述2.2.1数据挖掘的基本概念1989年在第11届国际联合人工智能学术会议中首次提出数据挖掘。它是指复杂
第2章相关理论基础-23-的发生,错误率最低。图2-2随机验证法原理2.3.2一致性检验一致性检验用于判断分类器结果与实际结果是否具有一致性,不同模型结果是否具有一致性和不同方法之间是否具有一致性。Kappa系数是用来评价一致性的指标值,用来检验分类结果与实际结果一样的计数与那些仅为偶然结果的期望是否存在不同。参照表2-1,加权Kappa系数等于简单Kappa系数。具体公式如下:0eeP-PKappa=1-P(2-26)式中,0TP+TNP=P+N,e2(TP+FN)(TP+FP)+(FP+TN)(FN+TN)P=(P+N),0P为实际一致率,eP为理论一致率。一般认为,Kappa>0构建的模型才具有实际意义,Kappa值越大,一致性越好。若0<Kappa<0.4,说明一致性差;若0.4<Kappa<0.75,一致性一般;若0.75<Kappa<1,一致性好。Kappa=1,说明结果完全一致,Kappa=0表示结果不存在一致性。2.3.3ROC曲线受试者工作特征曲线(ROC曲线),是一种比较模型分类效果坐标图的可视化工具,用来展示灵敏度和特异度之间的相互关系。1960年开始,ROC分析被应用于医疗领域[51]。ROC曲线以灵敏度为纵坐标,(1-特异度)为横坐标,通过设定出多个不同的临界值,得出每个点对应的坐标,并绘制曲线,通过曲线下面积值(AUC值)用
【参考文献】:
期刊论文
[1]浅谈大数据在医疗行业的应用[J]. 曹景禹. 通讯世界. 2019(04)
[2]《中国心血管病报告2018》概要[J]. 胡盛寿,高润霖,刘力生,朱曼璐,王文,王拥军,吴兆苏,李惠君,顾东风,杨跃进,郑哲,陈伟伟. 中国循环杂志. 2019(03)
[3]基于动态采样和迁移学习的疾病预测模型[J]. 胡满满,陈旭,孙毓忠,沈曦,王晓青,余天洋,梅御东,肖立,程伟,杨杰,杨焱. 计算机学报. 2019(10)
[4]我国脑卒中防治仍面临巨大挑战——《中国脑卒中防治报告2018》概要[J]. 王陇德,刘建民,杨弋,彭斌,王伊龙. 中国循环杂志. 2019(02)
[5]C5.0决策树与RBF神经网络模型用于急性缺血性脑卒中出血性转化的风险预测性能比较[J]. 王海东,张璐,王洁,李晶,周莹,王国立,汪可可,彭延波,武建辉. 中华疾病控制杂志. 2019(02)
[6]大理居民脑卒中患者危险因素的Logistic回归分析[J]. 徐弘扬,杜小珊,杨锡彤,马蓉,王光明. 大理大学学报. 2018(08)
[7]进展性缺血性脑卒中的相关因素分析[J]. 徐荣薇. 中国实用神经疾病杂志. 2018(11)
[8]医疗大数据在肿瘤疾病中的应用研究[J]. 宋波,朱甜甜,于旭,冯云霞,张中. 中国数字医学. 2017(08)
[9]基于灰色关联分析与随机森林回归模型的短期负荷预测[J]. 张冰,周步祥,石敏,魏金萧. 水电能源科学. 2017(04)
[10]临床医疗大数据研究现状与展望[J]. 陆易,黄正行,俞思伟,段会龙. 医疗卫生装备. 2017(03)
博士论文
[1]分类方法在中医辨证诊断应用中的比较研究[D]. 陈淑慧.广州中医药大学 2008
硕士论文
[1]面向糖尿病的临床大数据分析研究与应用[D]. 陈潋.东华大学 2016
[2]大数据背景下的医疗保险费用挖掘[D]. 关成敏.西安电子科技大学 2014
本文编号:3001518
【文章来源】:燕山大学河北省
【文章页数】:92 页
【学位级别】:硕士
【部分图文】:
技术路线图
第2章相关理论基础-13-(2)健康评估:健康评估是推动健康管理的专业技术,它根据采集的健康信息,确定个体或群体现处于的健康状态,同时通过数学或计算机等方式构建疾病患病风险预测模型,对个人或群体的患病风险进行预测。(3)健康分析:在健康评估的基础上,对预测结果进行分析,找出可干预的危险因素,帮助个人全面认识自我健康风险并制定健康管理计划。(4)健康干预:健康管理循环的最终目标,它是在之前步骤的基础下,根据制定的健康管理个性化服务方案纠正不良生活作息。疾病发病的危险因素日趋复杂,要调节我国增长的健康需求与短缺的医疗资源之间的平衡,最高效的方法就是进行科学的健康管理。目前,健康管理的方法如图2-1所示,方法1表明通过医疗干预可以减弱危险因素对健康的影响[47];方法2与方法3表明,通过健康管理可以调节危险因素对健康的影响[48];方法4为医疗干预对健康管理的反溃通过图2-1可以发现,健康管理在危险因素与医疗干预之间起到调控与缓冲作用。一方面,通过健康管理达到疾病预防或者早发现、早诊断、早治疗,从而减少医疗资源的需求;另一方面,可以优化医疗资源配置,实现效益最大。图2-1健康管理与危险因素、医疗干预之间的关系2.2数据挖掘及其算法概述2.2.1数据挖掘的基本概念1989年在第11届国际联合人工智能学术会议中首次提出数据挖掘。它是指复杂
第2章相关理论基础-23-的发生,错误率最低。图2-2随机验证法原理2.3.2一致性检验一致性检验用于判断分类器结果与实际结果是否具有一致性,不同模型结果是否具有一致性和不同方法之间是否具有一致性。Kappa系数是用来评价一致性的指标值,用来检验分类结果与实际结果一样的计数与那些仅为偶然结果的期望是否存在不同。参照表2-1,加权Kappa系数等于简单Kappa系数。具体公式如下:0eeP-PKappa=1-P(2-26)式中,0TP+TNP=P+N,e2(TP+FN)(TP+FP)+(FP+TN)(FN+TN)P=(P+N),0P为实际一致率,eP为理论一致率。一般认为,Kappa>0构建的模型才具有实际意义,Kappa值越大,一致性越好。若0<Kappa<0.4,说明一致性差;若0.4<Kappa<0.75,一致性一般;若0.75<Kappa<1,一致性好。Kappa=1,说明结果完全一致,Kappa=0表示结果不存在一致性。2.3.3ROC曲线受试者工作特征曲线(ROC曲线),是一种比较模型分类效果坐标图的可视化工具,用来展示灵敏度和特异度之间的相互关系。1960年开始,ROC分析被应用于医疗领域[51]。ROC曲线以灵敏度为纵坐标,(1-特异度)为横坐标,通过设定出多个不同的临界值,得出每个点对应的坐标,并绘制曲线,通过曲线下面积值(AUC值)用
【参考文献】:
期刊论文
[1]浅谈大数据在医疗行业的应用[J]. 曹景禹. 通讯世界. 2019(04)
[2]《中国心血管病报告2018》概要[J]. 胡盛寿,高润霖,刘力生,朱曼璐,王文,王拥军,吴兆苏,李惠君,顾东风,杨跃进,郑哲,陈伟伟. 中国循环杂志. 2019(03)
[3]基于动态采样和迁移学习的疾病预测模型[J]. 胡满满,陈旭,孙毓忠,沈曦,王晓青,余天洋,梅御东,肖立,程伟,杨杰,杨焱. 计算机学报. 2019(10)
[4]我国脑卒中防治仍面临巨大挑战——《中国脑卒中防治报告2018》概要[J]. 王陇德,刘建民,杨弋,彭斌,王伊龙. 中国循环杂志. 2019(02)
[5]C5.0决策树与RBF神经网络模型用于急性缺血性脑卒中出血性转化的风险预测性能比较[J]. 王海东,张璐,王洁,李晶,周莹,王国立,汪可可,彭延波,武建辉. 中华疾病控制杂志. 2019(02)
[6]大理居民脑卒中患者危险因素的Logistic回归分析[J]. 徐弘扬,杜小珊,杨锡彤,马蓉,王光明. 大理大学学报. 2018(08)
[7]进展性缺血性脑卒中的相关因素分析[J]. 徐荣薇. 中国实用神经疾病杂志. 2018(11)
[8]医疗大数据在肿瘤疾病中的应用研究[J]. 宋波,朱甜甜,于旭,冯云霞,张中. 中国数字医学. 2017(08)
[9]基于灰色关联分析与随机森林回归模型的短期负荷预测[J]. 张冰,周步祥,石敏,魏金萧. 水电能源科学. 2017(04)
[10]临床医疗大数据研究现状与展望[J]. 陆易,黄正行,俞思伟,段会龙. 医疗卫生装备. 2017(03)
博士论文
[1]分类方法在中医辨证诊断应用中的比较研究[D]. 陈淑慧.广州中医药大学 2008
硕士论文
[1]面向糖尿病的临床大数据分析研究与应用[D]. 陈潋.东华大学 2016
[2]大数据背景下的医疗保险费用挖掘[D]. 关成敏.西安电子科技大学 2014
本文编号:3001518
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3001518.html
最近更新
教材专著