多个云环境下大数据工作流性能优化算法的设计与实现
本文关键词: 工作流映射 云计算 性能优化 大数据 出处:《西北大学》2017年硕士论文 论文类型:学位论文
【摘要】:随着云计算技术的不断发展,融合多个云计算环境的混合云越来越得到广泛的应用。在许多科研应用程序中,要得到最终结果需要执行一系列任务。而这些任务,如数据生成、处理、分析等,之间存在着相互依存的关系,这些任务组合及其相互依存关系构成了工作流。在很多具体的大数据应用实践中,工作流技术已经成为不可或缺的一部分。目前云计算服务分为三种:软件即服务(Software as a Service,SaaS),平台即服务(Platform as a Service,PaaS),基础设施即服务(Infrastructure as a Service,IaaS)。基础设施即服务是将计算资源抽象成一个个虚拟机,将虚拟硬件资源提供给用户。它对于大数据工作流的执行是最适用的。对于一个工作流,可以直接应用云平台所提供的虚拟硬件资源来执行各个任务,就像传统的运行在集群上的工作流一样。在实际应用中,预算约束和可靠性约束都是对大数据工作流的部署非常重要的约束。预算约束是保证工作流能以较低的成本运行完成,而可靠性约束针对的是真实的云环境中的各种不确定性和故障。本文针对在预算和可靠性双重约束条件下的多个云环境中工作流映射问题,抽象出问题的数学模型,分析了问题的复杂性,设计了启发式算法,并进行了实验比较。文章证明了问题的复杂度是属于NP-Complete的,并且通过实验发现本文提出的算法相比较之前的算法有明显的优越性。本文对于工作流映射的研究分为以下几部分:问题的提出与复杂性的证明。本文针对预算受约束,通过工作流映射,建立了针对两种不同可靠性要求下的端对端延迟最小化问题的数学模型。通过复杂性分析,证明了这两个问题都是一类NP-Complete问题的子问题,从而得到这两个问题也都是NP-Complete 的。问题的分析与算法的设计。针对这两个问题,分别提出了启发式算法RMCWM和EMCWM,算法分为虚拟机选择、物理机及带宽选择两个阶段。由于问题中对可靠性的建模采用了 3GG模型,在分析该模型特性的基础上,发现了优化可靠性的规律。并将这种规律融入算法的设计中,取得了很好的效果。模拟实验和性能评估。本文对所设计的算法针对不同规模的云和不同数量的云组合,进行了模拟实验。实验证明了不论在小规模的云组合的情况下还是大规模的云组合的情况下,该算法对比之前的算法都有明显的优越性。
[Abstract]:With the continuous development of cloud computing technology, the hybrid cloud, which integrates multiple cloud computing environments, is becoming more and more widely used. In many scientific applications, a series of tasks, such as data generation, are required to achieve the final results. Processing, analysis, and so on, there are interdependent relationships between these tasks and their interdependence constitute a workflow. In many specific big data application practice, Workflow technology has become an integral part. Cloud computing services are currently divided into three categories: software as a service, platform as a service, infrastructure as a service, infrastructure a service, IaaSan. Infrastructure as a service is to be computed. Resources are abstracted into virtual machines, Provide virtual hardware resources to users. It is most suitable for the execution of big data workflow. For a workflow, you can directly apply the virtual hardware resources provided by the cloud platform to perform various tasks. In practical applications, both budget constraints and reliability constraints are very important constraints for the deployment of big data workflow. Budget constraints are to ensure that the workflow can be completed at a lower cost. The reliability constraint is aimed at all kinds of uncertainties and faults in the real cloud environment. In this paper, the mathematical model of the problem is abstracted from the workflow mapping problem in multiple cloud environments under the condition of double constraints of budget and reliability. The complexity of the problem is analyzed, the heuristic algorithm is designed, and the experimental results are compared. It is proved that the complexity of the problem belongs to NP-Complete. And through experiments, it is found that the proposed algorithm has obvious advantages compared with the previous algorithm. The research of workflow mapping in this paper is divided into the following parts: the presentation of the problem and the proof of complexity. Based on workflow mapping, a mathematical model for end-to-end delay minimization problem with two different reliability requirements is established. Through complexity analysis, it is proved that these two problems are subproblems of a class of NP-Complete problems. It is concluded that these two problems are also NP-Complete. The analysis of the problem and the design of the algorithm. In view of these two problems, the heuristic algorithms RMCWM and EMCWM are proposed, which are divided into virtual machine selection. Because the 3GG model is used in the reliability modeling, based on the analysis of the characteristics of the model, the law of optimizing reliability is found, and the law is integrated into the design of the algorithm. Good results have been achieved. Simulation experiments and performance evaluation. In this paper, the algorithm is designed for different size of the cloud and different number of cloud combinations, The experimental results show that the proposed algorithm is superior to the previous algorithm in the case of small scale cloud combinations and large scale cloud combinations.
【学位授予单位】:西北大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP393.09;TP311.13
【相似文献】
相关期刊论文 前10条
1 罗海滨,范玉顺,cims.tsinghua.edu.cn,吴澄;工作流技术综述[J];软件学报;2000年07期
2 李华,李燕,姚文琳;工作流管理[J];山东轻工业学院学报(自然科学版);2000年04期
3 刘建勋,李仁发,张申生;工作流管理系统及其在邮电号线管理中的应用[J];计算机工程与应用;2001年18期
4 汪涛,吴耿锋,黄力芹;工作流管理的现状和未来趋势[J];小型微型计算机系统;2001年02期
5 汪涛,黄力芹,吴耿锋;工作流管理的发展历程和趋势[J];计算机工程与科学;2001年01期
6 罗海滨,范玉顺,吴澄;工作流合理性验证中的事件平衡分析[J];软件学报;2002年08期
7 周尊国 ,田伟;工作流管理系统在电力企业管理信息系统中的应用[J];山东电力技术;2002年02期
8 黄钧 ,范永全 ,郭勇;工作流管理系统在建设项目管理中的应用[J];微型机与应用;2002年09期
9 张志君,范玉顺;一种高性能的分布式工作流系统实现框架[J];计算机集成制造系统-CIMS;2003年06期
10 赵卫东,戴伟辉;基于角色的跨组织工作流研究[J];系统工程与电子技术;2003年08期
相关会议论文 前10条
1 卓蔚;陈思;张侃弘;;工作流管理技术浅谈——如何实现企业业务信息化的工作流管理[A];上海烟草系统2002年度学术论文选编[C];2002年
2 李晖;王海洋;王文;;面向事务的工作流活动模型[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
3 连杰鑫;刘家茂;顾宁;;基于协作依赖的工作流过程优化[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
4 李新;薛永生;;可重构工作流系统设计方法研究[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
5 叶寿生;汪涛;郭永林;;LTFP intelliFlow~汶工作流管理系统[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
6 冯波;徐建良;;支持动态变化的工作流元模型的研究与应用[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
7 丁华;王秀坤;周永晖;;基于改进移动模型的迁移工作流研究[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
8 崔立真;王海洋;;基于主动过程视图的工作流管理和监控[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
9 欧阳青;;工作流技术在高校教育管理系统中的应用研究[A];第十八届玻璃钢/复合材料学术年会论文集[C];2010年
10 吕刚;王坚;严隽薇;董志斌;;工作流技术及其在制造企业中的应用研究[A];第二十届中国控制会议论文集(下)[C];2001年
相关重要报纸文章 前10条
1 庄志澄;成功实施工作流管理系统[N];中国计算机报;2003年
2 中国石油勘探开发研究院西北分院 柏东明 曾丽花 郭以东;定制企业工作流服务[N];计算机世界;2011年
3 中国建设银行湖北分行信息技术部李涛、娄国伟、曾钦祥、吴安平、童海涛;实现多任务域工作流[N];计算机世界;2004年
4 王沛霖;驾驭流程 创造价值[N];中国计算机报;2004年
5 李农、张京辉;客服中心上档次依赖工作流管理系统[N];中国计算机报;2002年
6 何吟;“行业”标签让SunFlow更醒目[N];计算机世界;2004年
7 优利系统(中国)有限公司 倪佳;影像与工作流技术在银行业的应用[N];网络世界;2001年
8 邹洪强;应用系统的另类整合[N];计算机世界;2005年
9 中国软件评测中心 于春玲;企业业务流程管理系统的新亮点[N];中国计算机报;2004年
10 山西焦煤集团驻深圳办事处 刘鹏;基于企业过程建模的工作流管理系统研究[N];山西科技报;2002年
相关博士学位论文 前10条
1 许荣斌;实例密集型商务工作流任务调度与分配策略研究[D];安徽大学;2015年
2 刘怡;基于工作流的连锁超市生鲜货品营运流程管理研究[D];华中科技大学;2007年
3 刘英博;工作流运行时人员智能分配技术研究[D];清华大学;2008年
4 王睿;面向目标的迁移工作流主动服务方法研究[D];山东大学;2009年
5 吴修国;面向目标的迁移工作流建模方法研究[D];山东大学;2010年
6 丁柯;网络分布计算中的事务工作流研究[D];中国科学院研究生院(软件研究所);2003年
7 肖郑进;面向企业应用的工作流精简建模研究[D];浙江大学;2006年
8 柯飞帆;面向分布应用的工作流管理系统研究与实现[D];南京航空航天大学;2006年
9 田珂;开放网络环境下工作流管理系统的技术研究[D];电子科技大学;2006年
10 程杰;迁移工作流过程分解及其规划方法研究[D];山东大学;2011年
相关硕士学位论文 前10条
1 张亚楠;基于工作流的民政临时救助业务系统设计与实现[D];郑州大学;2017年
2 王世锋;基于客户交互关系的服务工作流优化技术研究[D];中南大学;2008年
3 严刚;分布式工作流事务处理建模与设计[D];上海交通大学;2009年
4 李敬刚;基于活动信息传递的工作流验证的研究与实现[D];大连理工大学;2010年
5 彭永;基于移动Agent工作流的研究与实现[D];哈尔滨工程大学;2010年
6 梁晓明;工作流技术及其在外商投资审批(绿色通道)中的应用[D];机械科学研究院;2002年
7 段江波;工作流管理系统的安全研究[D];大连理工大学;2005年
8 赵淳;一种可适应性工作流的研究与实现[D];中国科学院研究生院(软件研究所);2005年
9 张海;工作流技术在法院案件管理系统中的应用[D];河海大学;2007年
10 周文斌;基于角色访问控制的工作流管理系统的信息安全研究[D];同济大学;2007年
,本文编号:1520206
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1520206.html