当前位置:主页 > 科技论文 > 计算机论文 >

基于Hadoop的云计算模型研究与应用

发布时间:2020-05-26 10:56
【摘要】:随着社会进步和互联网技术发展,网络数据量飞速增长且规模日渐庞大,不管是企业还是个人都面临如何对这些海量数据进行有效存储和分析的难题。面对正在增长的海量数据,传统数据处理方法存在数据存储成本过高、海量数据管理较困难、可靠性较低、效率低下、并行处理程序编写困难等诸多缺点。人们需要一种新的技术思想来解决这些问题。云计算的思想就很自然地被提出来。 云计算通过整合互联网络中的闲散资源,对外提供强大的存储和计算能力,以及一些其它解决方案。Hadoop是一个开源分布式数据处理框架,被用于高效地处理海量数据。由于Hadoop具有可伸缩性、高可靠性、低成本性和高效性等优点,已成为一种流行的云计算开发平台。但是Hadoop也存在一定的缺陷,例如,在Hadoop集群中只要一个名字节点来管理整个文件系统的元数据和执行重要的文件系统操作。这会限制集群的可扩展性、可用性;另外,在传统Hadoop中,计算和存储是紧耦合的,这也会对集群的性能造成限制。 本文的研究课题是基于Hadoop的云计算模型研究与应用,主要目标是:分析传统Hadoop框架的性能瓶颈,设计一种新的Hadoop框架;在改进传统Hadoop框架的基础上,设计基于改进后的Hadoop的云计算模型,实现相应云计算平台,重点解决海量数据存储和分析的难题。 论文的主要工作和成果如下: ①介绍云计算的基础理论,包括云计算的概念、特点、关键技术和典型的平台应用。 ②阐述Hadoop的基础架构,包括分布式文件系统(HDFS)、并行编程模型MapReduce的原理和实现机制、Hadoop框架优化措施等。详细分析了HDFS的数据管理机制、性能保障措施、以及文件的读取和写入过程。 ③分析Hadoop的性能瓶颈,设计了一个新型的Hadoop架构,解决了传统Hadoop架构中的单名字节点的瓶颈问题,以及计算与存储紧耦合问题,通过理论分析和实验对比,论证了新框架的高效性。新框架具有高可用性和良好的可扩展能力。 ④完成了基于改进的Hadoop的云计算模型设计,结合WEB技术实现了云模型中功能模块的开发。 本文云计算模型具有高效性、高可靠性、低成本和易于使用等优点。此系统模型可应用于企业数据存储和计算、科学研究等领域,为海量数据存储和计算提供了高可靠性、低成本的解决方案,为云计算技术的发展和Hadoop应用提供了一种新的思路。
【学位授予单位】:重庆大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP3

【引证文献】

相关期刊论文 前1条

1 林大云;;基于Hadoop的微博信息挖掘[J];计算机光盘软件与应用;2012年01期

相关硕士学位论文 前3条

1 王东方;面向云计算的设备故障诊断系统关键技术研究[D];郑州大学;2012年

2 崔宁宁;面向电信运营的云计算模型研究[D];西北大学;2012年

3 虞乐;基于Hadoop平台下回归算法的性能研究[D];南华大学;2012年



本文编号:2681730

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2681730.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b1fde***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com