云计算平台下资源监控与态势评估方法研究
本文选题:OpenStack + 资源监控 ; 参考:《西安电子科技大学》2014年硕士论文
【摘要】:如今,大数据时代已经真正到来并逐渐对我们的生活产生了深远的影响。大数据时代中备受关注的是云计算领域的发展,通过人们对云计算概念的不断探索与实践,“云”的理念已经对技术发展有了深刻而远大的影响,也逐渐引起各界的关注。2003年,谷歌发表了核心论文来阐述云计算理念;2006年,亚马逊将云计算技术商业化;近些年,“云”已经触手可及,并可以作为一种服务深入我们的生活。这种环境下,催生了一些云计算平台,OpenStack就是最富代表性的。论文首先整理了相关的基础概念,包含云计算、云平台及虚拟化的知识,同时对现在比较流行的云平台进行了介绍;其次,论文对比分析了几种监控技术在不同场景下的应用;然后,论文对态势评估的概念、特点及评估要素等做了详细的阐述,同时对比了现有的态势评估的方法。基于以上内容,论文最终设计并实现了基于OpenStack云平台的单发/单收多播拓扑结构的监控系统部署方案,进而,通过对监控数据的处理,提出了云平台态势评估的方法。关于云监控系统的设计与实现,论文主要通过改进Ganglia默认的多发/多收的多播拓扑结构,设计单发/单收的拓扑结构,避免所有节点都要接收其他节点的指标数据,进而避免CPU资源不必要的浪费,消除大型集群的运行开销。同时,每个集群的gmetad守护进程使用RRD文件对资源数据信息进行汇聚,并汇总至主控节点,主控节点部署了利用Bootstrap、Highcharts、node.js等技术开发的UI模块,一方面,为管理员提供查看平台资源数据实时变化的平台系统;另一方面,为用户提供任务提交及结果查看等入口。论文中对态势评估方法的研究,主要目的是为了挖掘平台产生的大量数据潜在的价值。由于云平台的规模比较大,资源数据也比较复杂,论文所利用的态势评估方法主要借鉴D-S证据推理法及决策判断法,采用“点”和“段”的资源监控数据或日志信息对平台的健康状态及任务的运行情况进行评估及预测,同时,也可以通过监控数据的变化趋势来反应任务本身的特点,通过一段时间的任务执行情况来判断整个平台或者某个集群的稳定性,通过一些故障提示可以对平台的态势及故障原因进行分析,进而保证平台问题及时得到解决。云监控系统对于一个可靠的云平台来说是必要的,并为平台可用性提供支撑;态势评估方法直接影响云平台数据价值的最大化。最后,论文对所实现的系统进行了功能测试及性能测试,系统所表现出的实时性和稳定性都可以达到论文目标。
[Abstract]:Today, the big data era has really arrived and gradually had a profound impact on our lives. In the era of big data, the development of cloud computing has attracted much attention. Through the continuous exploration and practice of cloud computing, the concept of "cloud" has had a profound and far-reaching impact on the development of technology, and has gradually aroused the attention of all circles. Google has published a core paper on cloud computing; Amazon commercialized cloud computing technology in 2006; and in recent years, the cloud has been within reach and can be used as a service in our lives. In this environment, some cloud computing platform is the most representative OpenStack. Firstly, the paper summarizes the basic concepts, including cloud computing, cloud platform and virtualization, and introduces the popular cloud platform. Secondly, the paper compares and analyzes the application of several monitoring technologies in different scenarios. Then, the concept, characteristics and evaluation elements of situation assessment are described in detail, and the existing situation assessment methods are compared. Based on the above content, the paper finally designs and implements the deployment scheme of the monitoring system based on OpenStack cloud platform, which is based on the topology of single send / single receive multicast. Furthermore, through the processing of monitoring data, the method of cloud platform situation assessment is put forward. As to the design and implementation of cloud monitoring system, this paper mainly improves ganglia's default multicast topology, designs single send / receive topology, and avoids all nodes receiving index data from other nodes. Then avoid unnecessary waste of CPU resources and eliminate the running overhead of large clusters. At the same time, the gmetad daemons of each cluster use the RRD file to aggregate the resource data information and aggregate it to the master control node, which deploys the UI modules developed using the technologies such as Bootstrapger, Highchartsnnode.js, etc., on the one hand, On the other hand, it provides users with access to task submission and result viewing. The main purpose of this paper is to explore the potential value of a large amount of data generated by the platform. Because of the large scale of cloud platform and the complexity of resource data, the situation assessment methods used in this paper mainly draw lessons from D-S evidence reasoning method and decision judgment method. The resource monitoring data or log information of "dot" and "segment" are used to evaluate and predict the health status of the platform and the operation of the task. At the same time, the characteristics of the task itself can be reflected by monitoring the changing trend of the data. The stability of the whole platform or a cluster can be judged by a period of time task execution, and the situation and the cause of the fault can be analyzed through some fault hints, so as to ensure that the platform problem can be solved in time. Cloud monitoring system is necessary for a reliable cloud platform and provides support for platform availability. Situation assessment method directly affects the maximum value of cloud platform data. Finally, the function and performance of the system are tested, and the real-time and stability of the system can reach the goal of the paper.
【学位授予单位】:西安电子科技大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP393.08
【相似文献】
相关期刊论文 前10条
1 李静严;;济钢能源管控中心水资源监控与调度[J];电气时代;2009年05期
2 任怡;张菁;陈红;吴庆波;孔金珠;戴华东;管刚;;云应用引擎的资源监控和计费机制研究[J];通信学报;2012年S1期
3 罗建;;关注存储资源管理[J];中国电信业;2004年09期
4 陈刚;武永卫;柳佳;杨广文;郑纬民;;基于资源监控的网格调度系统[J];华中科技大学学报(自然科学版);2007年S2期
5 张燕妮;肖峰;张建威;戴冶;;网络系统资源监控与应用[J];网络安全技术与应用;2008年02期
6 余越;Unicengter TNG用于网络资源监控的原理与设计[J];上海铁道科技;2001年01期
7 ;系统尽在我掌控 系统资源监控软件Winpulse[J];电脑采购周刊;2004年23期
8 彭洪;易昌善;黄岩渠;;面向业务的IT资源监控系统设计[J];金融电子化;2008年03期
9 胡亮;车喜龙;;基于Nu-支持向量回归的网格资源监控与预测系统(英文)[J];自动化学报;2010年01期
10 方娟;张书杰;邸瑞华;黄河;;网格资源监控关键技术的研究[J];计算机应用与软件;2005年12期
相关会议论文 前2条
1 李晓阳;丁峰;翟玉建;;基于GMA的网络资源监控技术的研究与实现[A];第十六届全国青年通信学术会议论文集(上)[C];2011年
2 陈建香;刘欢;卢蓓蓉;;智慧校园中的地图建设研究——基于资源管控的视角[A];中国高等教育学会教育信息化分会第十二次学术年会论文集[C];2014年
相关重要报纸文章 前5条
1 侯军 摩卡软件有限公司资深售前经理 于尚民;IT业务融合需要深层监控[N];通信产业报;2009年
2 政务报道组;水利部力推国家水资源监控能力建设项目建设管理工作[N];中国水利报;2013年
3 通讯员 朱朝明;国家水资源监控能力建设项目办公室成立[N];中国水利报;2012年
4 刘恒 通讯员 包楠;重庆联通承建水资源监控自动化系统[N];人民邮电;2007年
5 记者 张强;湖北亿元投入建水资源在线监控体系[N];中国水利报;2014年
相关硕士学位论文 前10条
1 张仲妹;云计算环境下的资源监控应用研究[D];北方工业大学;2013年
2 梁立新;工商网络安全资源监控管理平台[D];四川大学;2004年
3 文新宇;资源监控与负载能力分析系统设计与实现[D];大连理工大学;2013年
4 靳京;面向用户的网格资源监控服务系统的研究[D];燕山大学;2006年
5 李玉凯;网格环境中资源监控技术的研究[D];华北电力大学(河北);2007年
6 陈红;云计算应用引擎计费机制研究与实现[D];国防科学技术大学;2011年
7 田X;基于Intranet的资源监控技术研究[D];国防科学技术大学;2006年
8 李晓阳;基于GMA的资源监控技术的研究与实现[D];南京航空航天大学;2010年
9 宋彩华;云资源监控中的数据传输模型研究[D];郑州大学;2013年
10 宋雪飞;基于MA的策略网管中资源监控的研究与设计[D];吉林大学;2005年
,本文编号:2001726
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2001726.html