基于电子病历数据挖掘的急性冠脉综合征风险评估方法研究
发布时间:2021-03-07 10:16
心血管疾病是全球死亡的主要原因之一,急性冠脉综合征(ACS,Acute Coronary Syndrome)为其中的一种,在其早期治疗中,评估患者会发生诸如心肌梗死、中风或者死亡等不良事件的风险程度是一个非常重要的阶段。对病人的个体风险评估,可以帮助医生选择最合适的治疗策略,降低ACS致死率。传统的诸多评分工具如GRACE,TIMI等,大多根据队列研究建立。其由于队列研究严格的入组条件,使得样本与实际临床环境存在偏差,同时由于使用较少的风险因子,限制了工具的性能,并难以纳入新的风险因子。近年来随着医院信息化的发展,更多的基于机器学习的模型被开发出来,这些模型使用电子病历数据,更好地反应了真实的临床环境,可以纳入更多的风险因子,使用先进的机器学习模型,可以取得更好的性能。然而,这些模型中仍然存在一些问题,如现存的模型通常忽略数据集样本之间、特征之间的关联信息,以及ACS本身存在三种不同诊断亚型(STEMI,NSTEMI,UA),现有的模型并未考虑亚型之间的区别与关联信息。为了可以更好的处理样本之间、特征之间的关联信息,本论文提出关系正则化的ACS患者风险评估方法,通过拉普拉斯算子将样本之...
【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
图1-2?:?2002-2016年中国城乡地区急性心梗死亡率变化趋势[4]??在ACS患者的早期治疗中,评估患者会发生诸如心肌梗死、中风或者死亡??等不良事件的风险程度是一个非常重?
浙江大学硕士论文?关系正则化的ACS患者风险评估??2关系正则化的ACS患者风险评估??根据医生所建议的,风险评估方法应当在病人住院的早期阶段提供相应的风??险预测服务,图2-1展示了如何进行这样的一个服务。所以我们主要从患者的入??院记录中提取实验数据集,即从电子病历记录(EHR,Electronic?health?records)??中收集患者入院阶段记录的患者数据。入院记录是EHR数据中非常关键的部分,??通常包含了许多有价值的信息,如患者的病史,检查检验结果以及一些特定的检??查。此外,患者的首次诊断和常见合并症或并发症通常在患者的入院记录中给出。??在临床实践中,医生经常参考ACS患者个体的入院记录来确定其临床发病风险。??从这方面来说,可以利用入院记录,研究医疗案例,提供重要的ACS风险因子,??并利用这些因素来帮助医生预测住院早期患者的临床风险,并更好的改善临床实.??践,以便实现更好的个性化治疗。??风险评估棋型??C?^?(?(?,????^?^?1?—#??*???;?^??■?—???—????—??? ̄ ̄???--???—?'?、—,???—???—???—?—???—???—?????高危??患者特征:蠢??_?★?入陕阶段:J?住院阶段:^?'j??图2-1:使用电子病例数据进行风险评估流程图??2.1数据集介绍??论文中的数据集主要来自于国内某三甲医院心血管内科,从电子病历系统中??收集了共3463份急性冠脉综合患者的数据,这些数据中包括了患者入院记录、??检查检验记录。在之前的工作中[3Q],我们基于
浙江大学硕士论文?关系正则化的ACS患者风险评估??图2-2中展示了低中高危各个模型的ROC曲线图。可以看到使用了正则项??的各个模型的ROC曲线明显高于两个基线模型,综合三个正则项的模型比起仅??使用了?L2正则化模型在ROC曲线上略胜一筹,该图较为直观地证明了我们提??出的模型具有更好的性能,样本关系正则项和特征关系正则项可以有效提升模型??在风险评估上的性能。??1.?0?1??0.?6??0.90-???Softraax?Regression??Proposed????—'???Proposed-Feat??2?〇.?86.?^??一一???Proposed-Samp??〇.?84?J????I???Proposed-L2??0.7?0.8?0.9?1.0???Random?Forest??0.0??i?1?.?.?.??0.0?0.2?0.?4?0.?6?0.8?1.0??样本大小??图2-3:样本大小实验??为了确定样本大小对于模型性能的影响,每次选取部分样本对模型进行评估,??可以看到,随着样本量的增加,各个模型的性能都处于一个上升阶段。在样本较??少时,随机森林可以取得最好的性能,但样本量上升,对于随机森林的性能提升??并不明显。其余的模型在样本数量达到60%后性能进入平台期,即样本量继续增??加,性能提升相对有限。??低亀风》因子权》?中龟风哙因子杈寶?高危风除因子权曹????'????———?>?>■?>???mu?—?'??|—|???轉?——■-??I擊?Mil??>?旮鑰朦*?1^—1?W
【参考文献】:
期刊论文
[1]《中国心血管病报告2018》概要[J]. 胡盛寿,高润霖,刘力生,朱曼璐,王文,王拥军,吴兆苏,李惠君,顾东风,杨跃进,郑哲,陈伟伟. 中国循环杂志. 2019(03)
[2]中国人群乙型病毒性肝炎血清流行病学调查——乙型肝炎疫苗接种降低乙型肝炎病毒感染率[J]. 崔富强. 中国疫苗和免疫. 2010(04)
本文编号:3068896
【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
图1-2?:?2002-2016年中国城乡地区急性心梗死亡率变化趋势[4]??在ACS患者的早期治疗中,评估患者会发生诸如心肌梗死、中风或者死亡??等不良事件的风险程度是一个非常重?
浙江大学硕士论文?关系正则化的ACS患者风险评估??2关系正则化的ACS患者风险评估??根据医生所建议的,风险评估方法应当在病人住院的早期阶段提供相应的风??险预测服务,图2-1展示了如何进行这样的一个服务。所以我们主要从患者的入??院记录中提取实验数据集,即从电子病历记录(EHR,Electronic?health?records)??中收集患者入院阶段记录的患者数据。入院记录是EHR数据中非常关键的部分,??通常包含了许多有价值的信息,如患者的病史,检查检验结果以及一些特定的检??查。此外,患者的首次诊断和常见合并症或并发症通常在患者的入院记录中给出。??在临床实践中,医生经常参考ACS患者个体的入院记录来确定其临床发病风险。??从这方面来说,可以利用入院记录,研究医疗案例,提供重要的ACS风险因子,??并利用这些因素来帮助医生预测住院早期患者的临床风险,并更好的改善临床实.??践,以便实现更好的个性化治疗。??风险评估棋型??C?^?(?(?,????^?^?1?—#??*???;?^??■?—???—????—??? ̄ ̄???--???—?'?、—,???—???—???—?—???—???—?????高危??患者特征:蠢??_?★?入陕阶段:J?住院阶段:^?'j??图2-1:使用电子病例数据进行风险评估流程图??2.1数据集介绍??论文中的数据集主要来自于国内某三甲医院心血管内科,从电子病历系统中??收集了共3463份急性冠脉综合患者的数据,这些数据中包括了患者入院记录、??检查检验记录。在之前的工作中[3Q],我们基于
浙江大学硕士论文?关系正则化的ACS患者风险评估??图2-2中展示了低中高危各个模型的ROC曲线图。可以看到使用了正则项??的各个模型的ROC曲线明显高于两个基线模型,综合三个正则项的模型比起仅??使用了?L2正则化模型在ROC曲线上略胜一筹,该图较为直观地证明了我们提??出的模型具有更好的性能,样本关系正则项和特征关系正则项可以有效提升模型??在风险评估上的性能。??1.?0?1??0.?6??0.90-???Softraax?Regression??Proposed????—'???Proposed-Feat??2?〇.?86.?^??一一???Proposed-Samp??〇.?84?J????I???Proposed-L2??0.7?0.8?0.9?1.0???Random?Forest??0.0??i?1?.?.?.??0.0?0.2?0.?4?0.?6?0.8?1.0??样本大小??图2-3:样本大小实验??为了确定样本大小对于模型性能的影响,每次选取部分样本对模型进行评估,??可以看到,随着样本量的增加,各个模型的性能都处于一个上升阶段。在样本较??少时,随机森林可以取得最好的性能,但样本量上升,对于随机森林的性能提升??并不明显。其余的模型在样本数量达到60%后性能进入平台期,即样本量继续增??加,性能提升相对有限。??低亀风》因子权》?中龟风哙因子杈寶?高危风除因子权曹????'????———?>?>■?>???mu?—?'??|—|???轉?——■-??I擊?Mil??>?旮鑰朦*?1^—1?W
【参考文献】:
期刊论文
[1]《中国心血管病报告2018》概要[J]. 胡盛寿,高润霖,刘力生,朱曼璐,王文,王拥军,吴兆苏,李惠君,顾东风,杨跃进,郑哲,陈伟伟. 中国循环杂志. 2019(03)
[2]中国人群乙型病毒性肝炎血清流行病学调查——乙型肝炎疫苗接种降低乙型肝炎病毒感染率[J]. 崔富强. 中国疫苗和免疫. 2010(04)
本文编号:3068896
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3068896.html
最近更新
教材专著