面向软件定义数据中心的故障检测与恢复技术研究
本文关键词: 软件定义网络 失效检测 失效恢复 软件定义数据中心 出处:《西南交通大学》2017年硕士论文 论文类型:学位论文
【摘要】:随着云计算的快速发展,传统架构的数据中心往往难以满足业务的高速增长,因此基于虚拟化、SDN等技术构建的软件定义数据中心以其弹性计算、池化资源等优势得到了学术界和工业界的认可。然而随着复杂度的提升,数据中心故障检测和故障恢复也变得愈发困难。本文从以下方面讨论了软件定义数据中心内的故障处理,并给出了一系列故障检测与恢复措施。首先,在实际应用中,面向SDN交换机的固定周期心跳检测机制被证明存在灵活性差、检测周期设置困难等不足。为此,本文设计了一种交换机自适应失效检测算法,它基于实时网络负载和检测响应时间,能够动态调整检测周期。同时为保证检测结果的可靠性,该算法使用二次检测机制来处理因网络丢包、交换机响应超时等情况造成的检查失败问题。其次,本文研究了基于OpenFlow的网络故障分类检测与重路由恢复机制。由于单一故障往往引发多个对象的检测失败事件,该方案选择在执行恢复机制前对检测结果进行过滤和合并,从而为恢复模块提供准确的故障信息。同时,该方案使用了一种基于链路实时负载的重路由恢复机制,以保证恢复后网络负载的均衡性。再次,本文利用SDN易于编程的特性,设计并实现了基于网络边缘检测的负载均衡跨层恢复机制。该方案根据SDN控制器在网络层的检测结果更新负载均衡服务的配置,以改进现有方案在以下方面的不足:(1)服务器与交换机间的网络故障因位于网络边缘,故无法通过重路由技术进行恢复。高虚拟化比例下该类故障可能波及大量的虚拟机,会严重影响用户体验。(2)传统方案通过构建负载均衡集群提供业务,并辅以健康检查以保证业务的高可用性。但该方案在大规模部署时,大量健康检查数据流会减少数据中心网络的有效带宽,并给计算和网络设备带来额外负载。最后,为实现以上检测与恢复方案,本文结合SDN控制器、云操作系统OpenStack和恢复控制器等应用组建了软件定义数据中心故障检测与恢复系统。通过在生产环境中对该系统的有效性和性能测试,其结果表明该系统能够支持数据中心故障的检测和恢复,可改进数据中心可靠性、增强用户体验并降低运维成本。
[Abstract]:With the rapid development of cloud computing, the traditional data center is often difficult to meet the rapid growth of business, so software defined data center based on virtualization and SDN technology is flexible computing. Pool resources and other advantages have been recognized by academia and industry. However, with the increase of complexity. Data center fault detection and fault recovery become more and more difficult. This paper discusses the following aspects of software defined data center fault processing, and gives a series of fault detection and recovery measures. In practical applications, the fixed-cycle heartbeat detection mechanism for SDN switches has been proved to have some shortcomings, such as poor flexibility, difficult to set up the detection cycle, and so on. In this paper, an adaptive fault detection algorithm for switches is designed, which can dynamically adjust the detection cycle based on real-time network load and detection response time, and ensure the reliability of the detection results. The algorithm uses the secondary detection mechanism to deal with the network packet loss, switch response timeout and other situations caused by the check failure. Secondly. In this paper, the mechanism of network fault classification and rerouting recovery based on OpenFlow is studied. The scheme chooses to filter and merge the detection results before executing the recovery mechanism, so as to provide accurate fault information for the recovery module. At the same time. This scheme uses a rerouting recovery mechanism based on link real-time load to ensure the balance of network load after recovery. Thirdly, this paper makes use of the easy programming characteristic of SDN. The cross-layer recovery mechanism of load balancing based on network edge detection is designed and implemented. This scheme updates the configuration of load balancing service according to the detection results of SDN controller in network layer. To improve the existing scheme in the following aspects of the lack of network fault between the server and the switch because of the network edge. Therefore, it can not be recovered by rerouting technology. In high virtualization scale, this kind of failure may affect a large number of virtual machines, which will seriously affect the user experience. 2) traditional solutions provide services by building load balancing clusters. But when the scheme is deployed on a large scale, a large number of health check data streams will reduce the effective bandwidth of the data center network. And bring extra load to computing and network equipment. Finally, in order to achieve the above detection and recovery scheme, this paper combines SDN controller. The software defined data center fault detection and recovery system is built by cloud operating system (OpenStack) and recovery controller. The validity and performance of the system are tested in the production environment. The results show that the system can support the fault detection and recovery of the data center, improve the reliability of the data center, enhance the user experience and reduce the cost of operation and maintenance.
【学位授予单位】:西南交通大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP308;TP393.0
【相似文献】
相关期刊论文 前10条
1 郭嘉凯;;软件定义存储:将用户从硬件绑定中解放[J];软件和信息服务;2014年05期
2 章必雄;基于软件定义的多模式无线网络[J];武汉理工大学学报(信息与管理工程版);2005年02期
3 Ron Harrison;;通讯测量无国界 软件定义测试平台后势看涨[J];电子测试;2006年11期
4 袁航;;软件定义负载均衡[J];软件和信息服务;2014年02期
5 王伟;;趋势之七 金融业“软件定义”滥觞期[J];金融电子化;2014年03期
6 王丛;;软件定义存储市场趋势[J];电脑与电信;2014年06期
7 王丛;;软件定义存储价值[J];电脑与电信;2014年06期
8 王丛;;如何评估软件定义存储[J];电脑与电信;2014年06期
9 翁继东;;软件定义网络关键技术及其实现研究[J];电子技术与软件工程;2014年04期
10 蔡学镛;;软件的病态性肥胖[J];程序员;2008年04期
相关会议论文 前1条
1 王加莹;;软件定义OTN软件定义网络[A];OFweek宽带通信与物联网前沿技术研讨会论文集[C];2013年
相关重要报纸文章 前10条
1 何宝宏;软件定义的世界[N];人民邮电;2012年
2 本报记者 郭平;网络向软件定义融合演进[N];计算机世界;2012年
3 邓光青;软件定义网络风头正劲[N];中国质量报;2013年
4 本报记者 郭涛;软件定义存储:市场“二八”开[N];中国计算机报;2013年
5 本报记者 郭涛 策划;软件定义未来[N];中国计算机报;2013年
6 本报记者 李旭阳;软件定义汽车[N];计算机世界;2013年
7 梁敏;软件定义时代来临[N];电脑报;2013年
8 本报记者 刘春辉;全面的虚拟化是实现“软件定义”的重要基石[N];人民邮电;2013年
9 本报记者 郭涛;软件定义存储也要“打假”[N];中国计算机报;2014年
10 沈建苗 编译;软件定义存储,你准备好了吗?[N];计算机世界;2014年
相关博士学位论文 前4条
1 李索恒;软件定义网络中多媒体传输路由及缓存算法研究[D];中国科学技术大学;2016年
2 肖鹏;数据中心下软件定义网络的部署及应用[D];大连海事大学;2016年
3 唐思圆;软件定义网络中资源高效的多播传输研究[D];中国科学技术大学;2017年
4 林萍萍;软件定义网的东西向对等互联机制研究[D];清华大学;2014年
相关硕士学位论文 前10条
1 吴庆彪;软件定义网络Web认证与访问控制技术研究[D];西南交通大学;2015年
2 罗雨佳;一种内容中心网络的通用架构研究[D];电子科技大学;2014年
3 陈实;云计算中基于多租户的策略驱动型软件定义网络应用研究[D];复旦大学;2014年
4 袁建明;基于SDN的ICN网络设计[D];云南财经大学;2015年
5 李泽旺;软件定义一体化网络仿真平台研究与实现[D];电子科技大学;2015年
6 马俊青;面向软件定义网络的流量分析与识别技术研究[D];南京邮电大学;2015年
7 黄锦松;软件定义的内容中心网络关键技术研究[D];南京邮电大学;2015年
8 王小威;软件定义移动自组网技术及原型设计[D];南京邮电大学;2015年
9 李杰;云环境下一种基于软件定义安全服务的入侵检测算法研究[D];南京邮电大学;2015年
10 王莉;面向QoE驱动的软件定义网络业务流控制研究[D];南京邮电大学;2015年
,本文编号:1485785
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1485785.html