当前位置:主页 > 科技论文 > 计算机论文 >

基于Hadoop的海量医疗数据存储系统的研究与实现

发布时间:2017-09-06 23:50

  本文关键词:基于Hadoop的海量医疗数据存储系统的研究与实现


  更多相关文章: 海量数据存储 医疗数据 Hadoop HBase 负载均衡


【摘要】:随着医疗信息化又健康又快速的发展,医疗数据迅速的涌现出来。然而,现存的医疗数据存储平台不能够满足日益增长的海量数据的需求。因此,研究并开发一个有效的存储平台来管理和存储这些海量医疗数据显得尤其的重要。 云计算为目前所面临的存储分析医疗数据困难,提供了一种低成本、容错性强、高可扩展性和可用性的解决方案。基于分布式计算技术,本文提出了一种新的管理和存储海量医疗数据的方法。它提供了一种基于Hadoop,使用Linux集群技术的海量数据存储的解决方案。 基于云存储和Hadoop技术在国内外的研究现状,本文设计了基于Hadoop的医疗存储系统,该系统包括三个部分:存储中心、管理中心和应用中心。数据存储中心以HBase作为数据库,分布式文件系统为其提供了底层存储支持。 本文对HDFS原有的负载均衡算法进行改进,提出了一种多指标的负载均衡算法,并将其应用于本系统的管理中心,用来控制集群负载的分配和迁移。 本文对系统进行了实现,搭建了Hadoop集群环境,并在应用中心,编写了数据管理软件,实现了数据的存储、查看、检索等功能。最后利用压力测试实验,验证了系统在高负载量的情况下,具有优良的负载均衡性能。 论文最后总结了本文所做的工作,并对未来的工作进行了展望,提出了下一步的研究方向。
【关键词】:海量数据存储 医疗数据 Hadoop HBase 负载均衡
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP333
【目录】:
  • 摘要4-5
  • ABSTRACT5-9
  • 第一章 绪论9-15
  • 1.1 论文背景与意义9-11
  • 1.1.1 海量医疗数据9-10
  • 1.1.2 云存储技术10
  • 1.1.3 Hadoop技术10-11
  • 1.2 国内外研究现状11-12
  • 1.3 本文主要工作及创新点12-13
  • 1.4 本文组织结构13-15
  • 第二章 基于HADOOP的云存储技术概述15-23
  • 2.1 Hadoop分布式文件系统15-18
  • 2.1.1 HDFS体系结构介绍15-16
  • 2.1.2 HDFS读写文件流程16-18
  • 2.1.3 HDFS负载均衡策略18
  • 2.2 MapReduce计算模型18-19
  • 2.3 HBase数据库19-21
  • 2.3.1 概述19-20
  • 2.3.2 系统框架20-21
  • 2.3.3 HBase数据模型21
  • 2.4 本章小结21-23
  • 第三章 基于HADOOP的海量医疗数据存储系统的设计23-39
  • 3.1 系统需求与总体设计23-25
  • 3.1.1 系统需求23-24
  • 3.1.2 总体设计24-25
  • 3.2 海量医疗数据存储中心25-28
  • 3.2.1 存储架构25-26
  • 3.2.2 存储表结构的设计26-28
  • 3.3 海量医疗数据管理中心28-37
  • 3.3.1 负载均衡策略29-30
  • 3.3.2 多指标负载均衡算法30-37
  • 3.4 海量医疗数据应用中心37-38
  • 3.5 本章小结38-39
  • 第四章 基于HADOOP的海量医疗数据存储系统的实现39-61
  • 4.1 Hadoop集群环境的配置39-44
  • 4.1.1 Hadoop集群介绍及硬件配置39-40
  • 4.1.2 Hadoop集群软件环境配置40-41
  • 4.1.3 Hadoop集群的运行41-44
  • 4.2 Hadoop医疗存储系统的功能设计44-46
  • 4.3 数据库设计46-49
  • 4.4 Hadoop医疗存储系统的实现49-55
  • 4.4.1 用户登录模块49
  • 4.4.2 用户管理模块49-50
  • 4.4.3 医疗数据管理模块50-55
  • 4.5 系统性能测试及结果分析55-59
  • 4.5.1 实验环境55
  • 4.5.2 实验设计55-57
  • 4.5.3 实验结果及分析57-59
  • 4.6 本章小结59-61
  • 第五章 总结与展望61-63
  • 5.1 总结61-62
  • 5.2 展望62-63
  • 参考文献63-65
  • 致谢65-66
  • 作者攻读学位期间发表的学术论文目录66

【参考文献】

中国期刊全文数据库 前2条

1 李坤;王百杰;;服务器集群负载均衡技术研究及算法比较[J];计算机与现代化;2009年08期

2 陈庆奎;周利珍;;基于HBase的大规模无线传感网络数据存储系统[J];计算机应用;2012年07期



本文编号:806193

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/806193.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户73fec***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com