基于Hadoop的医院数据中心系统设计与实现
发布时间:2017-09-09 11:52
本文关键词:基于Hadoop的医院数据中心系统设计与实现
【摘要】:随着国民经济的发展,医院信息化进程的不断推进,以电子病历、PACS系统等为代表的临床信息系统得到了广泛的使用。医院推进信息化过程中,数据存储问题日益凸现出来,传统分散式的数据存储模式有着明显的缺陷,数据安全性、可靠性得不到保障,数据备份繁琐,并且无法挖掘数据的潜在价值,因此数据中心建设提上医院信息化日程。鉴于以传统Unix服务器为基础的数据中心具有成本高、计算能力不足、数据读取速度相对较慢等缺陷,本论文结合当前计算机技术潮流,提出以Hadoop分布式框架为基础构建医院数据中心系统。 本论文针对医院数据存储的实际需求,结合Hadoop框架的自身特点,使用Hadoop、HBase、Hive、Mahout等在大数据时代得到广泛使用的技术,构建医院数据中心。本数据中心在克服传统Unix服务器缺点、满足医院数据存储需求的同时,为医院提供私有云和大数据的机器学习平台。本论文首先完成医院数据中心系统的开发,然后以电子病历系统为例,实现了结构化数据在数据中心的高速读取和存储;以PACS系统为例,实现了非结构化数据在数据中心的高速存储和读取;在机器学习平台上实现了推荐引擎算法。 以Hadoop分布式框架为基础构建医院的数据中心系统具有实施成本低、数据存储安全可靠、系统易扩展、数据读写速度快、计算能力强等特点。数据中心系统与现有医院临床信息系统可实现无缝集成,为医院提供结构化数据和非结构化数据的高速存储。在数据集中存储的基础上,利用Hadoop集群强大的计算能力,构建大数据的机器学习平台,挖掘数据背后的信息,为医生提供临床决策支持。系统解决了医院数据存储问题,使医院更加信息化、一体化、智能化,促进了医院信息化发展。
【关键词】:数据中心 Hadoop 集成 机器学习
【学位授予单位】:浙江大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP308
【目录】:
- 致谢4-5
- 摘要5-6
- Abstract6-8
- 目录8-10
- 第1章 绪论10-18
- 1.1 研究背景10-11
- 1.2 研究现状11-13
- 1.3 研究意义13-16
- 1.4 研究内容16-18
- 第2章 相关理论与技术18-35
- 2.1 Hadoop18-20
- 2.1.1 简介18-19
- 2.1.2 Hadoop的总体架构19-20
- 2.2 HDFS20-24
- 2.2.1 简介20
- 2.2.2 HDFS架构20-21
- 2.2.3 HDFS的数据管理21-24
- 2.3 MapReduce24-27
- 2.3.1 简介24
- 2.3.2 MapReduce原理24-27
- 2.4 HBase27-32
- 2.4.1 简介27
- 2.4.2 HBase架构27-29
- 2.4.3 HBase数据管理29-32
- 2.5 Hive32-35
- 2.5.1 Hive简介32
- 2.5.2 Hive的体系结构32-34
- 2.5.3 Hive的数据存储34-35
- 第3章 医院数据中心系统设计概述35-46
- 3.1 系统开发概述35-37
- 3.1.1 系统开发目标35-36
- 3.1.2 系统开发的可行性研究36-37
- 3.2 系统详细设计37-46
- 3.2.1 总体设计37-39
- 3.2.2 结构化数据存储设计39-42
- 3.2.3 非结构化数据存储设计42-45
- 3.2.4 机器学习平台设计45-46
- 第4章 医院数据中心系统的实现46-61
- 4.1 数据中心平台系统的构建46-51
- 4.1.1 数据中心运行平台搭建47-50
- 4.1.2 机器学习平台实现50-51
- 4.2 结构化数据存储实现51-55
- 4.2.1 结构化数据存储平台构建51-52
- 4.2.2 结构化数据存储系统的实现52-55
- 4.3 非结构化数据存储实现55-61
- 4.3.1 非结构化数据存储平台构建55-57
- 4.3.2 非结构化数据存储系统实现57-61
- 第5章 总结展望61-63
- 5.1 总结61-62
- 5.2 展望62-63
- 参考文献63-66
- 作者在硕士研究生期间的科研成果66
【参考文献】
中国期刊全文数据库 前10条
1 何禹;胡宇鸿;王一波;;虚拟化技术在校园网数据中心的应用[J];电子科技大学学报;2007年S3期
2 张敏;陈云海;;虚拟化技术在新一代云计算数据中心的应用研究[J];广东通信技术;2009年05期
3 谭文辉;;利用VMware实现数据中心服务器虚拟化[J];舰船电子工程;2008年06期
4 程苗;;基于云计算的Web数据挖掘[J];计算机科学;2011年S1期
5 叶明全;宋念东;;基于HIS的医院数据仓库设计与实现[J];计算机工程与设计;2008年03期
6 李英壮;廖培腾;孙梦;李先毅;;基于云计算的数据中心虚拟机管理平台的设计[J];实验技术与管理;2011年05期
7 周铁成;;虚拟化技术在数据中心架构中的应用研究[J];现代计算机(专业版);2009年04期
8 程钦安;杨保卫;;医院数据中心建设探讨[J];中国数字医学;2007年03期
9 陈金雄;;医院信息系统发展及对存储和数据安全的新要求[J];中国医疗设备;2010年08期
10 吴勇;杨琛;;浅论医院数据中心[J];医疗装备;2008年04期
,本文编号:820298
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/820298.html