当前位置:主页 > 医学论文 > 医卫管理论文 >

基于Couchbase数据库医疗数据管理系统的研究与实现

发布时间:2020-04-29 03:21
【摘要】:医疗领域信息化技术日益成熟,在不断提高诊断水平和改善医疗服务质量的同时,大量结构各异的医疗数据也随之呈指数级增长,这使得医疗大数据成为研究热点。基于传统关系型数据库的医疗系统,在海量医疗数据存储性能和查询效率方面显得越来越力不从心。如何对海量异构的医疗数据进行有效存储、快速查询、高效处理、深度分析,已经成为大数据环境下很多大型医院急需解决的问题。本文以北京某大型医院的医疗数据管理需求为研究背景,设计并实现了一种基于Couchbase数据库的医疗数据管理系统。针对海量医疗数据的存储和高效查询需求,使用Couchbase数据库存储海量异构的医疗数据;利用其分布式特性,为医疗数据管理系统的存储能力提供动态扩展;利用其缓存机制和强大的索引功能,为用户提供高效的查询服务。针对海量医疗数据的高效处理需求,使用Hadoop平台来处理医疗数据,利用其与Couchbase数据库良好的交互性,对海量医疗数据进行高效处理。针对海量医疗数据深入分析需求,本文提出一种改进的剪枝FP-growth算法,并将该算法并行化实现,在Hadoop平台上挖掘疾病之间的关联规则,为医生提供医疗决策参考。根据业务需求,设计并实现了基于Couchbase数据库医疗数据管理系统的主要功能,搭建了Couchbase数据库集群和Hadoop大数据平台,实现了并行化改进的剪枝FP-growth算法,最后进行了系统测试。经过测试表明,基于Couchbase数据库的医疗数据管理系统能够有效地存储海量异构医疗数据,并且能够提供高效的查询;Hadoop大数据平台能够很好地与Couchbase数据库配合,实现医疗数据地高效处理;改进的剪枝FP-growth算法的执行效率要优于传统的FP-growth算法的执行效率,基于Couchbase数据库的医疗数据管理系统利用并行化改进的剪枝FP-growth算法能够高效地挖掘出疾病之间的关联规则,这些规则满足需求,能够为医生和病人提供医疗服务。
【图文】:

缺点,医疗领域,关系型数据库,数据库


图 2.2 医疗领域关系型数据库使用占比以上三种数据库也都存在各自的缺点,它们的共同缺点就是,对非结构化数化数据的处理能力不足。此外,MySql 和 Sqlserver 的动态扩展能力有限,当定程度时,系统内存空间将是一个难以解决的难题;Oracle 数据库虽然有数能力,但是步骤较为繁琐,并且需要的技术含量较高。显然,继续使用关系型数据库来存储医疗数据,无法满足存储海量异构医疗,这时候就需要选用 NOSQL 数据库来解决这个问题。当下市面上流行的非库有很多,需要选择一款最合适的来作为医疗数据管理系统的数据库。当下系型数据库主要有 HBase、Redis、MongoDB、Couchbase、Cassandra,它们点如表 2.1 所示。表 2.1 主流 NOSQL 对比库 优点 缺点ase容量大,一张表能够容纳上亿行,上百万列;能搜到所需的历史版本数据;可简单地实现开发时所需依赖较多、配置较麻烦,缺乏规范化文档;占用内存很大,读取性能不高。

对比图,对比图,算法,医疗数据


图 2.5 各算法耗时对比图表 2.2 和图 2.5 可知,在进行对比的 4 种关联规则算法中,FP-growth 算法较之算法处理数据的速度最快,也最为平稳,所以系统将选择 FP-growth 算法来挖据中的关联规则。但是当 FP-growth 在面大数据量时,算法所生成的 FP 树就特致 FP 树根本无法放进内存而不能对目标数据集进行频繁项集挖掘,此外,在下,两次扫描磁盘对算法执行效率和系统性能都有影响。所以,本文提出一种枝 FP-growth 算法,用其分析医疗数据之间的关联规则。章小结章首先分析当下医疗系统使用数据库的使用情况,并根据医疗数据的存储需求Couchbase 数据库存储数据;然后分析当下流行的大数据处理框架,根据需求,, Hadoop 来处理海量医疗数据;最后介绍关联规则的相关概念,并对比分析常则算法,决定采用 FP-growth 算法来挖掘医疗数据之间的关联规则,但是传统owth 的效率仍不理想,所以本文在之后将提出一种改进的剪枝 FP-growth 算法。
【学位授予单位】:西安科技大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:R197.3;TP311.52

【参考文献】

相关期刊论文 前8条

1 ;上海区域卫生信息化实践经验[J];中国信息界(e医疗);2014年03期

2 周光华;辛英;张雅洁;胡婷;李岳峰;;医疗卫生领域大数据应用探讨[J];中国卫生信息管理杂志;2013年04期

3 申德荣;于戈;王习特;聂铁铮;寇月;;支持大数据管理的NoSQL系统研究综述[J];软件学报;2013年08期

4 高汉松;肖凌;许德玮;桑梓勤;;基于云计算的医疗大数据挖掘平台[J];医学信息学杂志;2013年05期

5 秦延斌;夏书剑;;基于数据挖掘的医院诊疗系统的研究[J];科技信息;2012年11期

6 陈俊;陈孝威;;基于Hadoop建立云计算系统[J];贵州大学学报(自然科学版);2011年03期

7 周轶男;王宇;;Hadoop文件系统性能分析[J];电子技术;2011年05期

8 兰聪花;刘洋;唐占红;;AprioriTid挖掘频繁项集算法的改进[J];计算机应用与软件;2010年03期

相关硕士学位论文 前10条

1 李若晨;基于并行的Apriori数据挖掘算法的研究[D];吉林大学;2017年

2 丁晶晶;MapReduce框架下的任务调度算法研究[D];南京理工大学;2017年

3 Alladoumbaye Ngueilbaye(阿拉杜);健康医疗系统的数据挖掘研究[D];哈尔滨工业大学;2016年

4 娄书青;并行FP-growth关联规则算法研究[D];电子科技大学;2016年

5 周羿阳;基于Hadoop的医疗辅助诊断系统的设计与实现[D];东华大学;2016年

6 戴

本文编号:2644171


资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/yiyuanguanlilunwen/2644171.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9bdfc***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com