基于Couchbase数据库医疗数据管理系统的研究与实现
【图文】:
图 2.2 医疗领域关系型数据库使用占比以上三种数据库也都存在各自的缺点,它们的共同缺点就是,对非结构化数化数据的处理能力不足。此外,MySql 和 Sqlserver 的动态扩展能力有限,当定程度时,系统内存空间将是一个难以解决的难题;Oracle 数据库虽然有数能力,但是步骤较为繁琐,并且需要的技术含量较高。显然,继续使用关系型数据库来存储医疗数据,无法满足存储海量异构医疗,这时候就需要选用 NOSQL 数据库来解决这个问题。当下市面上流行的非库有很多,需要选择一款最合适的来作为医疗数据管理系统的数据库。当下系型数据库主要有 HBase、Redis、MongoDB、Couchbase、Cassandra,它们点如表 2.1 所示。表 2.1 主流 NOSQL 对比库 优点 缺点ase容量大,一张表能够容纳上亿行,上百万列;能搜到所需的历史版本数据;可简单地实现开发时所需依赖较多、配置较麻烦,缺乏规范化文档;占用内存很大,读取性能不高。
图 2.5 各算法耗时对比图表 2.2 和图 2.5 可知,在进行对比的 4 种关联规则算法中,FP-growth 算法较之算法处理数据的速度最快,也最为平稳,所以系统将选择 FP-growth 算法来挖据中的关联规则。但是当 FP-growth 在面大数据量时,算法所生成的 FP 树就特致 FP 树根本无法放进内存而不能对目标数据集进行频繁项集挖掘,此外,在下,两次扫描磁盘对算法执行效率和系统性能都有影响。所以,本文提出一种枝 FP-growth 算法,用其分析医疗数据之间的关联规则。章小结章首先分析当下医疗系统使用数据库的使用情况,并根据医疗数据的存储需求Couchbase 数据库存储数据;然后分析当下流行的大数据处理框架,根据需求,, Hadoop 来处理海量医疗数据;最后介绍关联规则的相关概念,并对比分析常则算法,决定采用 FP-growth 算法来挖掘医疗数据之间的关联规则,但是传统owth 的效率仍不理想,所以本文在之后将提出一种改进的剪枝 FP-growth 算法。
【学位授予单位】:西安科技大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:R197.3;TP311.52
【参考文献】
相关期刊论文 前8条
1 ;上海区域卫生信息化实践经验[J];中国信息界(e医疗);2014年03期
2 周光华;辛英;张雅洁;胡婷;李岳峰;;医疗卫生领域大数据应用探讨[J];中国卫生信息管理杂志;2013年04期
3 申德荣;于戈;王习特;聂铁铮;寇月;;支持大数据管理的NoSQL系统研究综述[J];软件学报;2013年08期
4 高汉松;肖凌;许德玮;桑梓勤;;基于云计算的医疗大数据挖掘平台[J];医学信息学杂志;2013年05期
5 秦延斌;夏书剑;;基于数据挖掘的医院诊疗系统的研究[J];科技信息;2012年11期
6 陈俊;陈孝威;;基于Hadoop建立云计算系统[J];贵州大学学报(自然科学版);2011年03期
7 周轶男;王宇;;Hadoop文件系统性能分析[J];电子技术;2011年05期
8 兰聪花;刘洋;唐占红;;AprioriTid挖掘频繁项集算法的改进[J];计算机应用与软件;2010年03期
相关硕士学位论文 前10条
1 李若晨;基于并行的Apriori数据挖掘算法的研究[D];吉林大学;2017年
2 丁晶晶;MapReduce框架下的任务调度算法研究[D];南京理工大学;2017年
3 Alladoumbaye Ngueilbaye(阿拉杜);健康医疗系统的数据挖掘研究[D];哈尔滨工业大学;2016年
4 娄书青;并行FP-growth关联规则算法研究[D];电子科技大学;2016年
5 周羿阳;基于Hadoop的医疗辅助诊断系统的设计与实现[D];东华大学;2016年
6 戴
本文编号:2644171
本文链接:https://www.wllwen.com/yixuelunwen/yiyuanguanlilunwen/2644171.html