基于Hadoop的医疗辅助诊断系统的设计与实现
本文选题:医疗大数据 + 医疗辅助诊断 ; 参考:《东华大学》2016年硕士论文
【摘要】:我国医院大范围建设以电子病历为重点的信息系统已进行了10多年。电子病历、实验室信息系统、医学影像传输和存储系统等信息系统已被引入到医院中,这使得医院积累了丰富的医疗数据资源。以上海交通大学医学院附属瑞金医院为例,每年产生的临床数据约在60TB。医疗数据包括了临床诊断、检验检查结果等类型,具有数据量大、数据形式多元、数据变化快、数据价值高的“大数据”特征。如何利用这些数据为临床医疗诊断提供数据支持、让医生更好地为病人服务,是信息化建设的更高要求。论文结合《基于瑞金医院的临床大数据平台建设和深度应用》实际项目,研究了基于大数据处理平台Hadoop的医疗辅助诊断系统。首先分析了医疗数据的特点,综述了数据挖掘相关技术。针对糖尿病人处方数据,研究了基于关联规则的药品推荐,并通过改进算法提高效率满足了医疗诊断的及时性要求。针对甲亢病人的检验数据,研究了基于逻辑回归的并发症预测,结合医疗数据特点,分析了数据清洗、集成、转换以及预测结果的评估相关技术。使用MapReduce和Spark两种计算模型,论文对医疗辅助诊断系统的药品推荐和并发症预测功能进行了实现,验证了课题研究方法和技术的有效性。论文的主要工作有以下几个方面。(1)研究了基于关联规则的药物推荐。利用数据挖掘中的关联规则算法,找出医疗处方数据中的频繁处方项集,并从频繁处方项集中寻找有意义的处方关联信息,在医生开具处方时提供辅助诊断作用。为了满足药品推荐的及时性需求,论文对关联规则的经典Apriori算法进行改进,提出基于前缀项集的Apriori算法,并在实际医疗处方数据上证明了改进算法的有效性。(2)研究了基于逻辑回归的并发症预测。针对病人的各种检验指标数据,结合数据挖掘中的逻辑回归算法建立分类模型,通过该模型对未来病人的患病情况进行判断,从而达到为医生提供辅助诊断的效果。在预测功能具体实现中,本文使用了1~99分位极值处理、基于熵的数值离散化、针对不平衡数据的模型评估方法等技术以保证最终预测模型的准确性。(3)在Hadoop平台上使用MapReduce计算模型,实现了药品推荐功能,并通过实验比较分析了经典和改进的Apriori算法的性能,验证了改进算法的有效性;使用Spark计算模型,实现了并发症预测功能,并以原发性甲状腺机能亢进症病症为例,详细分析了功能的实现过程,给出了预测结果。
[Abstract]:It has been more than 10 years since the construction of electronic medical records information system in Chinese hospitals. Electronic medical records, laboratory information systems, medical image transmission and storage systems have been introduced into hospitals, which makes hospitals accumulate rich medical data resources. Take Ruijin Hospital affiliated to the School of Medicine of Shanghai Jiaotong University as an example. The annual clinical data are about 60 TB. Medical data includes clinical diagnosis, test results and other types. It has the characteristics of large amount of data, multiform data, fast data change and high data value. How to make use of these data to provide data support for clinical medical diagnosis and to make doctors better serve patients is a higher requirement of information construction. Based on the practical project of "Clinical big data platform Construction and Deep Application based on Ruijin Hospital", a medical assistant diagnosis system based on big data processing platform is studied. Firstly, the characteristics of medical data are analyzed, and the related technologies of data mining are summarized. Based on the prescription data of diabetic patients, the drug recommendation based on association rules was studied, and the improved algorithm was used to improve the efficiency to meet the requirement of timely medical diagnosis. Based on the test data of hyperthyroidism patients, the prediction of complications based on logical regression was studied. Combined with the characteristics of medical data, the related techniques of data cleaning, integration, conversion and evaluation of predicted results were analyzed. By using MapReduce and Spark models, this paper realizes the function of drug recommendation and complication prediction of medical assistant diagnosis system, and verifies the effectiveness of the research method and technology. The main work of this paper is as follows: 1) Research on drug recommendation based on association rules. The association rules algorithm in data mining is used to find out the frequent prescription item set in the medical prescription data, and to search for meaningful prescription association information from the frequent prescription item set, and to provide the assistant diagnosis function when the doctor prescribes the prescription. In order to meet the timely demand of drug recommendation, this paper improves the classical Apriori algorithm of association rules, and proposes a Apriori algorithm based on prefix itemsets. The effectiveness of the improved algorithm is proved by the actual medical prescription data.) the complication prediction based on logical regression is studied. Based on the data of various test indexes of patients and the logical regression algorithm in data mining, a classification model is established, which is used to judge the disease situation of patients in the future, so as to provide assistant diagnosis for doctors. In the realization of the prediction function, the maximum value of 1 ~ 99 quartile is used in this paper, and the numerical value is discretized based on entropy. In order to ensure the accuracy of the final prediction model, the MapReduce computing model is used on the Hadoop platform to realize the drug recommendation function. The performance of the classical and improved Apriori algorithm is compared and analyzed through experiments. The effectiveness of the improved algorithm is verified, and the function of complication prediction is realized by using Spark calculation model. Taking the primary hyperthyroidism as an example, the realization process of the function is analyzed in detail, and the prediction results are given.
【学位授予单位】:东华大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13
【相似文献】
相关期刊论文 前10条
1 朱学才;用红外热图辅助诊断小儿炎症性呼吸道疾病[J];红外技术;1997年06期
2 许月琳;;基于Lyapunov特性指数的心电信号辅助诊断[J];苏州市职业大学学报;2010年03期
3 饶浩;陈红玲;;基于NBC的子宫肌瘤辅助诊断方法[J];韶关学院学报(自然科学版);2005年12期
4 吕优江;俞守义;;肺癌辅助诊断系统的开发[J];南方医科大学学报;2009年07期
5 余乃登,刘晴;脑血管病辅助诊断系统[J];数理医药学杂志;1995年01期
6 翟中生,程宪平;肿瘤细胞辅助诊断系统的研究[J];传感器技术;2005年02期
7 丁卫平;顾卫江;董建成;祁恒;;模糊逻辑推理在电子病历智能辅助诊断系统中的应用研究[J];南通大学学报(自然科学版);2006年04期
8 聂斌;王命延;邱桃荣;于海雯;方娜;;商集统计Rough sets及其医学辅助诊断模式[J];计算机工程与应用;2008年35期
9 宋嗣迪;;用计算机作拖拉机故障辅助诊断[J];计算机农业应用;1989年02期
10 戴浩,方思行;中医辅助诊断中带复合项的关联规则挖掘算法[J];暨南大学学报(自然科学与医学版);2005年03期
相关会议论文 前4条
1 刘峰;葛霁光;;基于共享信息发布体辅助诊断系统的有效规则增强方案[A];中国生物医学工程学会第六次会员代表大会暨学术会议论文摘要汇编[C];2004年
2 侯锐;周宏志;秦瑞峰;丁宇翔;刘平;王力锋;马洋;莫静珍;张述寅;胡开进;;采用CBCT辅助诊断严重拔牙并发症22例[A];第10次全国口腔颌面医学影像学专题研讨会暨国家级口腔颌面医学影像诊断学新进展学习班论文汇编[C];2012年
3 袁云娥;刘险峰;吴英杰;李洪娟;;应用现代红外影像技术开展中医辅助诊断数字影像化的实践与研究[A];全国第十二次中医诊断学术年会论文集[C];2011年
4 谢青;夏宏杰;;B超辅助诊断痉挛性斜颈指导治疗——附两例分析[A];中国康复医学会第三次康复治疗学术大会论文汇编[C];2002年
相关重要报纸文章 前1条
1 首席记者 孙燕明;242个地级以上城市实行辅助诊断检查互认制[N];中国消费者报;2007年
相关硕士学位论文 前10条
1 周羿阳;基于Hadoop的医疗辅助诊断系统的设计与实现[D];东华大学;2016年
2 李海鲲;计算机中医辅助诊断和医院信息管理系统的研究[D];合肥工业大学;2005年
3 聂涅;基于Internet的远程智能医疗辅助诊断系统[D];西安电子科技大学;2001年
4 倪洁;基于3G的急救辅助诊断系统的设计与实现[D];哈尔滨工业大学;2011年
5 佟勇;基于FPGA的辅助诊断系统[D];黑龙江大学;2013年
6 刘斯颀;面向智能服装的多信息融合医学辅助诊断的应用研究[D];东华大学;2010年
7 车国海;基于ATMS的复合型脾虚证辅助诊断系统的设计和实现[D];暨南大学;2006年
8 钟春燕;经食道超声心动图仿真辅助诊断系统的研制及临床应用[D];第三军医大学;2012年
9 吴裕豪;SVM分类模型在癌症突变辅助诊断中的应用[D];重庆大学;2014年
10 翟中生;肿瘤细胞辅助诊断系统的研究[D];华中科技大学;2005年
,本文编号:2046443
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2046443.html