基于任务并行策略的多核程序优化研究
发布时间:2020-04-13 21:02
【摘要】:随着多核处理器的普及,如何有效利用多核处理器资源,成为了并行计算领域的研究热点。现在很多应用程序都是在单核单线程环境下开发的,在多核环境下还是以单线程形式执行,导致了多核资源的浪费。为了能够充分发挥多核潜力,提升应用程序的性能。本文在深入分析多核并行技术的前提下,研究了基于任务并行策略的多核程序优化技术。任务并行的优势在于它是轻量级的组件,调度任务的开销要比调度进程和线程的开销小。 通过研究Intel线程构建模块(TBB),本文提出了基于任务调度器的的并行优化方法。该方法是通过任务调度器创建线程池管理任务,采用任务密取技术负载均衡地把任务自动地映射到多个逻辑线程上并行执行,从而提高多核资源的使用效率和应用程序的性能。针对多核集群环境提出了一种层次任务并行化方法,上层MPI提供节点间进程级的任务并行,下层TBB提供多核节点内部的任务并行。结合两者的优势,实现进程和处理节点以及线程和多处理核的两级并行。为了验证以上两种方法的高效性,以N皇后经典算法为例,分别在共享存储模型TBB和混合并行编程模型MPI+TBB环境下进行了循环迭代的并行化测验。实验结果表明,共享存储模型并行化的加速比和CPU利用率都能达到一个可观的数值,体现了任务调度器并行化的优越性;采用任务划分的混合并行编程模型不但可以减少程序执行时间,获得更好的加速比和执行效率,而且明显地提高了多核集群并行性能。 最后本文以模糊C均值算法为例,运用OpenMP工作分区编码,实现了多核平台下的串行程序热点区域的任务并行化。运用Intel parallel studio高性能工具对并行化结果进行验证,从执行时间和并发性方面进行了比较,其性能都有了很大的提高。体现了任务并行策略通用性和可靠性的特点,对多核应用程序的性能优化有很好的实用性。
【图文】:
图 2.1 多核集群结构Fig. 2.1 Multi-core cluster structure能指标]是衡量并行性能的一个指标,简单的说是并行程序的并行执行速快了多少,它是并行计算的核心。并行加速比=并行后整个任务的运行时间并行前整个任务的运行时间是随着处理器核数的增加,并行执行速度也相应的倍增。在实际很难符合理论的数值,主要有两大定律与加速比有关。hl 定律[12]:在问题规模一定的前提下,加速比不能随着处理器数升,而是受限于程序的可并行比例,加速比极限是可并行比例的一个任务在并行前的执行时间是 200s,可以被并行的时间是 100=50%,也就是说并行加速比的上限是 1/50%=2。因此我们可以一个方法是减少代码中串行部分的比例,增加并行部分的比例。
- 7 -图 2.3 细粒度任务划分Fig.2.3 Fine granularity task partitioning务之间有两种相关性:一种是顺序相关性,指的计算结果。也就是说必须保证执行一个任务这种潜在的数据竞争问题,我们在分配任务的程上,并且能保证线程执行的顺序;另一种是的共同操作。在大多数情况下,,我们使用锁或
【学位授予单位】:辽宁师范大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP332
【图文】:
图 2.1 多核集群结构Fig. 2.1 Multi-core cluster structure能指标]是衡量并行性能的一个指标,简单的说是并行程序的并行执行速快了多少,它是并行计算的核心。并行加速比=并行后整个任务的运行时间并行前整个任务的运行时间是随着处理器核数的增加,并行执行速度也相应的倍增。在实际很难符合理论的数值,主要有两大定律与加速比有关。hl 定律[12]:在问题规模一定的前提下,加速比不能随着处理器数升,而是受限于程序的可并行比例,加速比极限是可并行比例的一个任务在并行前的执行时间是 200s,可以被并行的时间是 100=50%,也就是说并行加速比的上限是 1/50%=2。因此我们可以一个方法是减少代码中串行部分的比例,增加并行部分的比例。
- 7 -图 2.3 细粒度任务划分Fig.2.3 Fine granularity task partitioning务之间有两种相关性:一种是顺序相关性,指的计算结果。也就是说必须保证执行一个任务这种潜在的数据竞争问题,我们在分配任务的程上,并且能保证线程执行的顺序;另一种是的共同操作。在大多数情况下,,我们使用锁或
【学位授予单位】:辽宁师范大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP332
【相似文献】
相关期刊论文 前10条
1 辛熠;杨瑞民;;多核DSP编程技术研究[J];电子测试;2011年09期
2 刘磊;周庆;井蔚;刘冰;;基于多核处理器的网络安全协议并行处理研究[J];信息网络安全;2011年09期
3 于永斌;徐洁;王华;张凤荔;吴晓华;丁旭阳;;计算机系统结构课程多核创新实验探索[J];实验科学与技术;2011年03期
4 赵辉;钱文光;杨丽娟;;OpenMP中负载平衡优化的分析与研究[J];福建电脑;2011年06期
5 傅忠传;高洋;李东;张泽旭;崔平远;李馨梅;;Metric多核子方法划分编译算法设计与实现[J];哈尔滨工业大学学报;2011年07期
6 李e
本文编号:2626437
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2626437.html