当前位置:主页 > 科技论文 > 软件论文 >

Hadoop环境下电子病历检索研究

发布时间:2020-09-19 17:17
   电子病历是医院信息管理的一个重要组成部分,包含了病人在医院、县乡卫生院就诊期间产生的全部医疗临床信息资源。电子病历系统的优劣对医疗信息共享、同病种案例对比以及医学领域学术研究具有重大的意义。然而,目前国内各大医院电子病历系统发展出现了很多问题,例如电子病历系统开发没有遵循统一标准,病历信息查询只能按照病人住院号或姓名之类的关键字,电子病历数据的增加导致检索速度慢等。所以如何存储剧增的电子病历数据,如何提高电子病历的检索效率,如果分析海量电子病历数据已经成为医疗界的研究热点。针对这种情况,本文在对电子病历国际标准、Hadoop平台、Lucene搜索框架以及数据挖掘技术进行深入研究的基础上,提出了一种Hadoop环境下的电子病历存储、检索和分析的解决方案,设计并实现了相应的原型系统。首先,将集中式存储与Hadoop的HDFS分布式存储相结合,创新地利用混合式存储方式来解决电子病历数据剧增的问题。其次,利用分布式、高性能的Map Reduce编程框架对电子病历数据进行预处理、分析器的实现以及建立电子病历的Lucene索引,从而实现电子病历的全文索引,解决了电子病历检索方式单一、检索速度慢的问题。接着,在Hadoop电子病历检索平台的基础上利用Map Reduce框架对检索后的数据进行Apriori数据挖掘优化算法分析,获取电子病历数据固定属性间的关联关系。最后,在实验室Hadoop集群环境下完成了系统的集成以及数据测试。结果表明,本文的方案不仅可以实现电子病历数据的存储、检索和分析,而且在检索功能、效率上都有明显的改善,具有一定的应用前景。
【学位单位】:河北工程大学
【学位级别】:硕士
【学位年份】:2016
【中图分类】:R197.3;TP311.13

【参考文献】

相关期刊论文 前10条

1 马锡坤;杨国斌;于京杰;;国内电子病历发展与应用现状分析[J];计算机应用与软件;2015年01期

2 朱媛媛;王晓京;;基于GE码的HDFS优化方案[J];计算机应用;2013年03期

3 刘娟;豆育升;何晨;唐红;;基于调度器的Hadoop性能优化方法研究[J];计算机工程与设计;2013年01期

4 刘树仁;宋亚奇;朱永利;王德文;;基于Hadoop的智能电网状态监测数据存储研究[J];计算机科学;2013年01期

5 张春明;芮建武;何婷婷;;一种Hadoop小文件存储和读取的方法[J];计算机应用与软件;2012年11期

6 何安勇;徐敏;吴敏U

本文编号:2822789


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2822789.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户69922***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com