基于时序图的医疗风险预测研究
发布时间:2018-05-11 17:45
本文选题:医疗数据 + 时序图 ; 参考:《山东大学》2017年硕士论文
【摘要】:随着信息技术的快速发展以及医疗信息系统的逐步健全,医疗与每个人的日常生活已息息相关,并产生了越来越多可利用的医疗大数据。在医疗领域,包括的医疗数据和信息类型非常广泛,可以大致分为以下三种:临床数据(Clinical Data)、体检数据(Biometric Data)、医保数据(Medicare Data)。基于上述医疗数据进行风险预测模型研究是当今一个很热的医学研究趋势,例如预测病人是否会患某种特定的疾病、预测病人未来会患不同疾病的概率风险等都属于医疗风险预测范畴。若可以利用医学数据进行有效的医疗风险预测模型研究,则可以大大降低医疗浪费,从而提高医疗质量,拥有更好的医疗服务。病人的电子健康档案(EHRs)以电子的形式系统性收集了病人在不同时间点的医疗健康信息,是指导数据驱动医疗研究的主要载体之一。鉴于原始EHRs数据的异构性、稀疏性等特点,直接使用未加工的EHRs去指导个性化医疗是非常具有挑战性的,因此,在进行具体的疾病风险预测应用之前需要对原始EHRs数据进行一致性表示,将未加工的电子健康档案数据转化为临床相关的特征信息是一个值得研究的问题。现已有一些工作基于EHRs数据提出了不同的预测方法,并对医疗数据进行了一致性表示,但使用图以及考虑不同医疗事件之间时序关系的表示形式研究的比较少,然而图具有直观易理解性并且时序关系能够捕捉到疾病未来发展趋势的重要信号,本文将上述两点进行结合,为每位病人构建一个医疗时序图,时序图的表示形式压缩了原始数据使其更紧凑,从而有效解决了医疗数据的稀疏性问题,并且为每位病人的分散数据提供了一种全景概括视图。本文主要在不同类型的医疗数据下,基于构建的病人时序图,针对现有风险预测工作存在的一些不足,对不同的医疗风险预测模型进行一系列研究。本文的具体工作和贡献概括如下:1.提出一种基于病人时序图的疾病风险预测方法(A Data-Driven Approach to Predict Medical Risk Based on Temporal Profile Graph,MTPGraph)。首先对每位病人的原始电子健康档案数据(EHRs)进行一致性表示,即提出一种时序图的表示形式;其次运用改进的Apriori频繁项集挖掘算法TRApriori,基于病人时序图挖掘频繁特征图;根据图的重构原理,每位病人的时序图可由时序特征图重新构成,最终获得针对不同病人的重构系数(即特征向量),对病人是否会患某种特定疾病进行有效预测。通过对两种真实临床场景的实验验证并与传统方法比较,结果显示该疾病风险预测方法可达到更好的预测效果。2.提出一种基于病人时序图表示的协同评估预测模型(Collaborative Prediction Model of Disease Risk by Mining Electronic Health Records,CAPM),仅需依赖病人EHRs数据中的疾病ICD-10编码来对病人未来会患不同疾病的概率风险进行预测。首先将每位病人的原始EHR数据表示为时序图;其次提出一种混合协同过滤方法,基于个人医疗历史记录和与其相似病人的医疗数据对每位病人的患病风险进行预测;另外,为了能够进行早期预防,提出一种计算对应疾病开始时间的方法。通过在真实的EHR数据集上进行的实验,结果证明CAPM能更好的对病人未来会患哪些疾病及对应疾病可能的开始时间进行预测。3.提出一种基于多类型医疗数据的疾病风险预测模型。首先将病人的三类医疗数据(临床EHRs、体检数据、医疗保险数据)进行有序链接,为每位病人构建一个医疗时序图;其次提出改进的AGM算法,基于所有病人的医疗时序图本身来挖掘频繁子图,利用所挖子图对病人是否患病进行预测;基于真实世界的三类型数据集对该方法在特定临床场景下进行验证,实验结果表明,与传统方法相比该方法是有效及高效的。
[Abstract]:With the rapid development of information technology and the gradual improvement of medical information system , medical care is closely related to the daily life of each person , and has produced more and more available medical data . In the medical field , including medical data and information types , it can be broadly divided into three categories : Clinical Data , Biometric Data , Medicare Data . The study of risk prediction model based on the above medical data is a very hot trend of medical research . For example , it is very challenging to predict whether the patient is suffering from a certain disease and predict the future of the patient . This paper presents a new method for predicting disease risk by using modified Apriori frequent itemset mining algorithm , and then proposes a new method for predicting the disease risk by using modified Apriori algorithm .
【学位授予单位】:山东大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:R-05;TP311.13
【相似文献】
相关会议论文 前1条
1 介龙梅;徐丽;谷文祥;;基于启发式策略的时序图规划研究[A];2005年全国理论计算机科学学术年会论文集[C];2005年
相关博士学位论文 前1条
1 韩文_";时序图数据处理技术研究[D];清华大学;2015年
相关硕士学位论文 前4条
1 王雪娇;基于UML时序图的系统形式模型自动生成研究[D];江西理工大学;2016年
2 张帅;基于时序图的医疗风险预测研究[D];山东大学;2017年
3 崔康乐;UML时序图模型到UPPAAL时间自动机模型转换方法研究和工具实现[D];华东师范大学;2011年
4 陈艳;重庆职业信息学院绩效考评系统的设计与实现[D];电子科技大学;2011年
,本文编号:1874938
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1874938.html