大规模云数据中心负载优化调度方法研究
本文关键词: 云数据中心 突发性负载 自相似性负载 负载生成 负载监控 负载优化调度 出处:《浙江大学》2014年博士论文 论文类型:学位论文
【摘要】:负载优化调度是指对负载进行合理高效地调度处理以实现特定的优化目标。随着大规模云数据中心在全球范围内的广泛部署,云数据中心负载优化调度正成为关系其服务能力建设及运营成本的重要方面,也是当前学术界的一个研究热点。而传统的负载优化调度方法不能很好地适应云计算应用的新特性,也无法很好地解决云计算带来的规模和复杂度挑战。本文围绕大规模云数据中心负载优化调度框架,云数据中心Web负载、Job负载及云数据中心之问批数据传输负载的优化调度方法展开研究工作,取得以下成果:针对传统负载优化调度系统可扩展性差,对云应用负载特性及智能化调度决策支持力度有限等不足,为大规模云数据中心提出一种可扩展、高效、智能化的负载优化调度系统JTangWOS. JTangWOS由基于数据分发服务DDS (Data Distribution Service)的负载监控平台,基于复杂事件处理CEP (Complex Event Processing)的调度决策支持平台,以及具体的负载优化调度系统组成。它能够很好地适应云数据中心的规模挑战,支持海量的监控数据收集和传输,支持各种复杂负载管理与调度决策的制定,并具有良好的可扩展性。实验还验证了该系统在负载优化调度方面的高效性(并发性和吞吐量分别提升4.8倍和20倍)及智能性。针对云计算应用基准程序Cloudstone,提出一种基于两阶段马尔科夫调制泊松过程MMPP2 (2-state Markov Modulated Possion Process)叠加模型的突发性和自相似性Web负载联合生成方法BURSE.该方法可以解决当前突发性和自相似性负载分别生成方法不能很好满足真实云Web应用负载情况的不足。与传统方法相比,该方法生成的负载更符合实际情况,并且所用方法更直观。接着,论文为大规模云数据中心系统提出了一种可感知突发性和自相似性的自适应负载均衡方法。实验表明所提负载生成方法具有很高的精度(各种突发性和自相似性强度组合平均误差都小于10%)及鲁棒性(精度不随负载样本数的增加而降低)。与传统贪婪和完全随机负载均衡算法相比,所提可感知突发性和自相似性的大规模云数据中心自适应负载均衡方法具有更好的性能和效率。针对大规模云数据中心地理位置分布的差异性,提出一种基于交替方向多乘子方法ADMM (Alternating Direction Method of Multipliers)的分布式算法,用来解决带有异构资源需求的Job在多个带有异构服务器的数据中心之间的优化调度问题。通过考虑不同数据中心所在地区之间的电价差异及用户请求到不同数据中心的网络延迟,为异构云数据中心多Job负载实现了一种成本最低的联合优化调度方法。实验表明,该方法在经过较少的几十次迭代(最多60次,80%的时间只需33次)后会收敛于一个实际中可接受的近似最优解。对比其他没有考虑数据中心和服务器联合调度的方法,所提方法能够完全保证用户服务质量QoS(Quality of Service)不被违反。对比其他只优化能耗成本或网络延迟效用损失的联合调度方法,所提方法能在效用损失和能耗成本之间实现一个更好的均衡,具有最低的总成本。针对云数据中心之间的批数据传输(Inter-DC Bulk Data Transfer)负载,通过利用批数据传输较高的延迟容忍性及不同地区数据中心电价的差异性,提出了一种能耗成本最低的两阶段优化调度方法。论文系统地研究了在大规模云数据中心网络中如何路由及调度批数据传输任务使得总能耗成本最小的问题,并用最小成本多并发流对该问题进行了建模。同时,还充分利用云数据中心之间批数据传输在时间和空间上的灵活性,提出一种高效的两阶段优化调度方法来求解该模型。基于真实云数据中心网络拓扑及真实历史电价数据,实验表明所提方法在降低数据中心能耗成本方面优于当前已有各种批数据传输优化调度方法及策略,其能耗成本降低率在闲时(凌晨)和忙时(傍晚)分别达到了31%和48%。另外,实验还表明所提方法具有较低的时间复杂度(与给定的可传输时间近似成线性关系),能够在性能和时间复杂度上实现一个好的均衡。
[Abstract]:Load scheduling refers to the load reasonably and efficiently processing to achieve specific optimization objectives. With the large scale cloud data centers are widely deployed in the global scope, cloud data center load scheduling is becoming the important aspect of the service ability construction and operation cost, it is also a research focus in the academic circles. But the traditional load optimal dispatch method can't adapt to the new features of cloud computing applications, is not a good solution for cloud computing brings the scale and complexity of the challenges. This paper focuses on large scale cloud data center load optimization scheduling framework, cloud data center Web load, Job load and cloud data center asked the optimization scheduling method batch data transmission load to launch the research work, has achieved the following results: Based on the traditional load optimal dispatching system of poor scalability of cloud application load characteristic and intelligent adjustment The limited degree of decision support, for the large-scale cloud data center provides a scalable, efficient, intelligent load optimal dispatching system of JTangWOS. JTangWOS by DDS based on data distribution service (Data Distribution Service) load monitoring platform, complex event processing based on CEP (Complex Event Processing) scheduling decision support platform, and the concrete load scheduling system. It can well adapt to the cloud data center scale challenges, support the massive monitoring data collection and transmission, support a variety of complex load management and decision making, and has good scalability. The experiment also validated the system load in optimal scheduling efficiency (the concurrency and throughput respectively increased 4.8 times and 20 times) and intelligence. According to the application of cloud computing benchmark program Cloudstone, based on the two phase of Marco Schiff (2-state MMPP2 modulated Poisson process Markov Modulated Possion Process) model burstiness and self similarity of Web combined with BURSE. load generation method this method can solve the burstiness and self similarity load respectively generation method can not satisfy the real application problems cloud Web load conditions. Compared with the traditional method, the method of load the more in line with the actual situation, and the method is more intuitive. Then, this paper puts forward a perceived bursty and self similar adaptive load balancing method of large-scale cloud data center system. Experiments show that the proposed load generation method with high accuracy (sudden and self similarity of intensity the average error is less than 10%) and robustness (accuracy and reduce with increase of load sample number). Compared with the traditional greedy and completely random load balancing algorithm, the proposed. Know the bursty and self similar large-scale cloud data center adaptive load balancing algorithm has better performance and efficiency. According to the difference of large-scale cloud data center location distribution, we proposed an alternating direction multiplier method based on ADMM (Alternating Direction Method of Multipliers) distributed algorithm is used to solve scheduling problem with heterogeneous the Job resource requirements among multiple heterogeneous servers with the data center. The price difference between considering different data center area and user requests to different data center network latency for heterogeneous cloud data center to achieve a joint optimization scheduling method of the lowest cost load Job. Experimental results show that this method in after several iterations less (up to 60 times, 80% time only 33) will converge to a practical approximation acceptable Optimal solution. Compared with other methods without considering the joint operation of the data center and server, the proposed method can fully guarantee the quality of service QoS (Quality of Service) is not violated. Compared to the other only optimize energy utility loss cost or network delay scheduling method, the proposed method can achieve a better balance between the utility the loss of energy consumption and cost, with the lowest total cost. According to the number of data transmission between the cloud data center (Inter-DC Bulk Data Transfer) load, through delay difference tolerance data center and different areas of electricity using batch data transmission is high, a two stage energy consumption of the lowest cost optimal scheduling method for the system. Study on how to route and schedule batch data transmission task makes the problem of minimum cost in the total energy consumption of large-scale cloud data center network, and with minimum cost Multi flow on the modeling of the problem. At the same time, but also make full use of the flexibility in time and space on the number of data transmission between the cloud data center, this paper presents a new two stage optimization scheduling method to solve the model. The real cloud data center network topology and the true history of price data based on the experiment shows that the proposed method to reduce data center energy cost than the current batch of various data transmission scheduling method and strategy, its cost is to reduce the rate at leisure (Ling Chen) and busy (evening) respectively reached 31% and 48%. in addition, the experiment also shows that the proposed method has low time complexity (and can be given the transmission time is approximately linear), can achieve a good balance between performance and complexity.
【学位授予单位】:浙江大学
【学位级别】:博士
【学位授予年份】:2014
【分类号】:TP308;TP393.01
【相似文献】
相关期刊论文 前10条
1 高美凤,须文波;造纸厂负荷优化调度系统[J];自动化仪表;2000年09期
2 钟嘉庆;;电力市场环境下有功优化调度方法综述[J];微型机与应用;2009年24期
3 黄永平;董仕宝;覃正强;;多机种保障加油作业优化调度系统研究[J];微计算机信息;2010年15期
4 陈华平,黄刘生,毛睿,陈国良;淮河群库优化调度系统的设计与实现[J];高技术通讯;1999年07期
5 石旭东;刘胜飞;陈慕华;王立文;;飞机集中除冰车辆优化调度方法研究[J];计算机工程与应用;2009年04期
6 张良兵,周建中;水电站优化调度仿真系统中实时数据库研究[J];计算机仿真;2004年08期
7 王秀利,吴惕华;成组作业生产优化调度的研究[J];化工自动化及仪表;2002年06期
8 王秀利,吴惕华,刘磊;一种求解单机成组作业优化调度的启发算法[J];计算机仿真;2003年02期
9 谢奕;夏成军;章文;黄莹;邹挺;;韶关水电站群优化调度系统软件的调试与优化[J];广东电力;2008年10期
10 赵然杭,王兴菊,孙继正;水库多目标优化调度[J];小型微型计算机系统;2002年05期
相关会议论文 前10条
1 赵和木;邹南城;;九龙江北溪梯级电站防汛与发电优化调度探讨[A];福建省科学技术协会第七届学术年会分会场——提高水力发电技术 促进海西经济建设研讨会论文集[C];2007年
2 邹南城;赵和木;;九龙江北溪梯级电站防汛与发电优化调度探讨[A];福建省科学技术协会第八届学术年会分会场——提高水电站水库调度技术 推进海西经济建设研讨会论文集[C];2008年
3 叶琳浩;夏成军;陈丽丹;张尧;;小水电优化调度的模型和算法研究[A];中国高等学校电力系统及其自动化专业第二十四届学术年会论文集(下册)[C];2008年
4 彭清娥;黄尔;刘兴年;;库区泥沙淤积对梯级水电站群优化调度影响研究[A];水文泥沙研究新进展——中国水力发电工程学会水文泥沙专业委员会第八届学术讨论会论文集[C];2010年
5 鲍正风;胡晓勇;;三峡水库汛前消落期优化调度方式研究[A];中国水力发电工程学会信息化专委会2009年学术交流会论文集[C];2009年
6 许江松;玄英姬;张子平;;对清江流域隔河岩、高坝洲梯级水电站优化调度的思考[A];2008中国水力发电论文集[C];2008年
7 陈庄;崔贯勋;刘永梅;何昭全;;卷烟生产线优化调度仿真系统研究[A];提高全民科学素质、建设创新型国家——2006中国科协年会论文集(下册)[C];2006年
8 殷传斌;赵新华;惠杨杨;;SCADA系统在供水优化调度中的应用[A];第七届青年学术会议论文集[C];2005年
9 杨侃;郑姣;陈静;;复杂巨型混联水电调度系统负荷分配方法研究[A];中国水文科技新发展——2012中国水文学术讨论会论文集[C];2012年
10 张宏杰;陈洲;张凡;王贵;常婧华;;浅谈反调节电站的“一键式”优化调度[A];全国大中型水电厂技术协作网第五届年会论文集[C];2008年
相关重要报纸文章 前7条
1 辛文;《跨区跨省电力优化调度暂行规则》出台[N];中国电力报;2003年
2 记者 邓明 白培生 通讯员 李秉钧;郴州优化调度大战旱魔[N];湖南日报;2011年
3 本报记者 陆文辉;加强优化调度 促进跨区送电[N];中国电力报;2003年
4 记者 潘峰;电监会优化电力调度规则[N];证券日报;2003年
5 记者 常志鹏;为什么要推行跨区电力优化调度[N];新华每日电讯;2003年
6 本报记者 童彤;缓解“江湖”新冲突 关键是优化调度[N];中国经济时报;2011年
7 谢德华;物流:第三利润源泉[N];中华读书报;2001年
相关博士学位论文 前10条
1 梁振成;中长期发电优化调度的近似动态规划模型与算法[D];广西大学;2015年
2 卢兴见;大规模云数据中心负载优化调度方法研究[D];浙江大学;2014年
3 刘双全;梯级水电系统发电优化调度研究及应用[D];华中科技大学;2009年
4 罗云霞;小水电群智能优化调度方法及系统开发[D];浙江工业大学;2009年
5 谢维;水电站(群)优化调度与运行规则研究[D];华北电力大学;2012年
6 曹广晶;三峡水库综合优化调度研究[D];天津大学;2004年
7 胡明罡;多沙河流水库电站优化调度研究[D];天津大学;2004年
8 张高峰;梯级水电系统短期优化调度与自动发电控制研究[D];华中科技大学;2004年
9 曾勇红;仿射尺度算法及其在水电系统优化调度中的应用研究[D];华中科技大学;2004年
10 喻杉;基于改进蚁群算法的梯级水库群优化调度研究[D];华北电力大学;2012年
相关硕士学位论文 前10条
1 王京波;考虑风电不确定性成本的含风电场群电力系统优化调度[D];燕山大学;2015年
2 王朋;梯级小水电优化运行技术研究[D];郑州大学;2015年
3 胡秀英;广西西江流域干流水库防洪优化调度研究[D];广西大学;2015年
4 邓显羽;余姚市水库(群)优化调度方法研究及应用[D];大连理工大学;2010年
5 王海伟;水电站短期优化调度及优化调度系统软件研究[D];华中科技大学;2005年
6 梁汉华;中小型电站水库日常发电调度的优化研究[D];浙江大学;2005年
7 徐晓燕;水电厂优化调度决策支持系统研究[D];重庆大学;2005年
8 李言龙;镜泊湖水库的优化调度与管理[D];华北电力大学(北京);2007年
9 李震;多水源优化调度的管理与决策[D];天津大学;2009年
10 竹磊磊;综合利用水库实时兴利优化调度研究[D];郑州大学;2006年
,本文编号:1545588
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1545588.html