基于重症监护数据库MIMIC-Ⅲ的探索性数据分析及急性心肌梗死死亡预测分析
发布时间:2020-06-14 09:07
【摘要】:研究背景及目的:医疗实践活动产生海量的数据,随着信息化的发展,我们得以用电子健康档案及时记录医疗数据,对这些数据进行深度挖掘利用对于提高医疗、护理质量和患者安全具有重要意义。在重症监护医疗数据仓库(Medical Information Mart for Intensive Care Ⅲ,MIMIC-Ⅲ)发布后,由于其具有大量的样本、高质量的数据结构和全方位的患者信息,许多临床医生想基于该数据库开展有价值的医学研究例如解决日常工作中受限于有限的观测样本而困扰自己的问题。探索性数据分析(Exploratory data analysis,EDA)是数据分析中常用的基本步骤,可以帮助研究人员识别数据中的结构和规律,有助于挖掘其潜在规律和价值。在对MMIC数据库的初步探索中,EDA可帮助研究人员提供了快速了解该数据库结构及数据特点,如人群的统计学分布、疾病比例等。在了解该数据库过程中,发现心血管系统疾病急性心肌梗死患者占有重要的比例,而目前对患者疾病严重程度判断需要丰富临床经验,因而临床医生提出了能否利用大数据分析方法建模分析急性心肌梗死危重症患者早期疾病严重程度的问题辅助医生决策支持。目的:1)解析MIMIC-Ⅲ患者疾病谱,从多个方向和维度展示数据分布信息,为基于MIMIC-Ⅲ数据库解决临床科研问题的临床医生及工程师提供相关数据参考,并了解探索性数据分析在电子健康档案(EHR)分析中的作用2)探索患有急性心肌梗死危重症患者早期死亡风险预测模型,辅助临床医生进行临床决策。方法:1)利用探索性数据分析方法探究MIMIC-Ⅲ数据库中各年龄层患者疾病及急症分布特点:首先,呈现MIMIC-Ⅲ中患者部分基本信息。其次,鉴于新生儿与成人间的巨大差异,对于非新生儿患者,以患者第一诊断分析各疾病类型在不同年龄段之间的分布,并按照国际疾病分类代码ICD-9逐步细化疾病分类,分析几大类主要疾病类型在各年龄段之间的基本信息,基于相同方法,分析新生儿孕周、体重、ICU住院时长等方面数据分布特点;并利用探索性数据分析说明无创血压有创血压测量一致性问题2)收集目标患者入院头24小时的人口统计学、生理生化参数以及其中蕴含的变异性、动态性特征作为解释变量,患者院内死亡作为结局变量,利用目前在其他领域常用且性能优异的机器学习算法如随机森林、xgboost等来建立分类模型来预测患者病情严重程度结果:1)对MIMIC-Ⅲ数据库中患者伤病谱分布进行详细描述,首先是MIMIC-Ⅲ数据库中首次入院46428例患者的基本情况介绍,总体入院患者年龄中位数为60(38.6-75.6)岁,循环系统疾病患者占比最大达到32%,损伤与中毒(14%)、消化系统(8%)、肿瘤(7%)、呼吸系统疾病(6%);其次根据系统疾病随年龄变化分布图,得到不同系统疾病随年龄变化的占比情况,探索并阐释了 MIMIC-Ⅲ数据库疾病谱特点。2)提取了 1220例急性心肌梗死患者的入ICU第一天的年龄、性别、种族、生命体征信息、生化检测、其他共64个特征,通过特征挑选得到25个特征,采用randomforest、xgboost机器学习算法建立的预测模型最优AUC达到0.86[0.83,0.90],性能优于传统SOFA和SAPS临床评分。结论:1)探索性数据分析技术在医疗数据分析领域的重要作用。通过对MIMIC-Ⅲ数据库患者伤病谱进行深度解析,能为相关领域研究者提供一定数据参考,利于先期掌握研究目标对象的体量及分布概况以及开展下一步研究2)使用MIMIC-Ⅲ数据库建立了基于机器学习方法预测急性心肌梗死患者院内死亡的风险预测模型,模型性能优于临床中常用的传统评分,能为临床医生及早识别患者的恶化及死亡风险,进行临床决策提供了辅助支持,可以作为开发下一代疾病严重程度评分的参考。电子健康档案为临床研究提供了宝贵的资源,基于大数据的分析方法在医疗领域的应用为我们理解疾病的发展过程、早期诊断、临床决策支持提供了更可靠的技术手段。
【学位授予单位】:中国人民解放军医学院
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:R542.22
【图文】:
由于MIMIC数据库全球免费开放使用,数据时间跨度大,有详细的患者个人逡逑数据等特点,大量学者、研宄员使用MIMIC数据库进行研究。通过整理、分析2000逡逑年到2017年所有基于MIMIC发表的杂志、会议期刊,下图1-2为MIMIC文献数逡逑1]逡逑
或之前的版本为研究材料,而MIMIC-III发布后,研宄重心就转移到MIMIC-III上,逡逑从2016年中旬开始,论文发表采用的均为MIMIC-III数据库。逡逑图1-2邋MIMIC文献发表随年份变化曲线逡逑基于MIMIC的研宄目前主要可以分为:逡逑90逡逑80逦80y逡逑70邋66邋/逡逑60逦I逡逑50逦/逡逑40逦39邋J逡逑30逦/逡逑20逦21X逡逑10邋1邋,逡逑1)
本文编号:2712564
【学位授予单位】:中国人民解放军医学院
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:R542.22
【图文】:
由于MIMIC数据库全球免费开放使用,数据时间跨度大,有详细的患者个人逡逑数据等特点,大量学者、研宄员使用MIMIC数据库进行研究。通过整理、分析2000逡逑年到2017年所有基于MIMIC发表的杂志、会议期刊,下图1-2为MIMIC文献数逡逑1]逡逑
或之前的版本为研究材料,而MIMIC-III发布后,研宄重心就转移到MIMIC-III上,逡逑从2016年中旬开始,论文发表采用的均为MIMIC-III数据库。逡逑图1-2邋MIMIC文献发表随年份变化曲线逡逑基于MIMIC的研宄目前主要可以分为:逡逑90逡逑80逦80y逡逑70邋66邋/逡逑60逦I逡逑50逦/逡逑40逦39邋J逡逑30逦/逡逑20逦21X逡逑10邋1邋,逡逑1)
【参考文献】
相关期刊论文 前5条
1 王宇娇;高岚;孙士艳;李春静;;高血压及休克患者有创与无创血压差异性的Meta分析[J];中华现代护理杂志;2015年33期
2 王剑;张政波;王卫东;潘亮;柴晓珂;;基于重症监护数据库MIMIC-Ⅱ的临床数据挖掘研究[J];中国医疗器械杂志;2014年06期
3 陈业群;谭学瑞;;无创与有创血压的差异及无创血压准确性的影响因素[J];中华高血压杂志;2009年03期
4 王丽霞;沈健;丁正年;;有创血压与无创血压准确性的评价以及对治疗的影响[J];国际麻醉学与复苏杂志;2013年11期
5 袁野;秦伟毅;卢勇;钱洪津;周伟良;华黎电;仲伯平;罗亮;林梵;;EICU救治患者的疾病分类特点[J];中国急救医学;2009年04期
本文编号:2712564
本文链接:https://www.wllwen.com/yixuelunwen/xxg/2712564.html
最近更新
教材专著