Intel多核与集成众核上CFD程序的OpenMP性能分析
本文选题:多核 + 集成众核 ; 参考:《计算机科学与探索》2015年10期
【摘要】:多核与众核已成为当前主流的高性能计算体系结构,Open MP编程是开发其并行计算能力的主要手段之一。针对一个实际高阶精度结构网格CFD(computational fluids dynamics)应用程序,采用基于硬件计数器的性能测试和模型分析的方法,系统地研究了其在Intel Xeon E5 Sandy Bridge多核处理器和Intel Knights Corner集成众核协处理器上的Open MP性能。重点分析了Open MP库开销、线程负载均衡性、主存访问带宽对性能的影响,发现因Open MP并行引入的冗余计算对并行效率影响很小,但串行计算部分和负载不均衡性对并行效率影响大,主存访问带宽对浮点性能的影响大。还比较了该程序两种体系结构上的性能差异,讨论了性能进一步优化的方向。
[Abstract]:OpenMP programming is one of the main methods to develop its parallel computing capability.For an actual high-order precision structured grid CFD(computational fluids dynamic program, the method of performance testing and model analysis based on hardware counter is adopted.The performance of Open MP on Intel Xeon E5 Sandy Bridge multi-core processor and Intel Knights Corner integrated multi-core coprocessor is systematically studied.The effects of Open MP library overhead, thread load balance and main memory access bandwidth on performance are analyzed. It is found that redundant computing introduced by Open MP parallel has little effect on parallel efficiency.However, the parallel efficiency is greatly affected by the unbalance of the serial computing part and the load, and the main memory access bandwidth has a great influence on the floating-point performance.The performance differences between the two architectures are compared and the direction of further performance optimization is discussed.
【作者单位】: 国防科技大学并行与分布处理重点实验室;国防科技大学计算机学院;
【基金】:国家自然科学基金~~
【分类号】:TP332
【相似文献】
相关期刊论文 前10条
1 徐海水,李显济;两种路障同步变量并行访问策略及性能分析[J];现代计算机;1997年04期
2 李孝忠,杜玉越;两类组合Petri网与性能分析[J];软件学报;1998年08期
3 陈虎,戴葵,杨晓东,胡守仁;JE-Java芯片中取指部件的设计和性能分析[J];计算机研究与发展;2001年03期
4 李建江;路川;张磊;;基于指导语句的CUDA程序性能分析工具研究与实现[J];电子科技大学学报;2012年02期
5 魏海;;三种存储技术的性能分析[J];硅谷;2008年16期
6 邵平凡;陈华斌;;基于Atmega8无线信号软件编解码的实现方法及性能分析[J];福建电脑;2009年08期
7 杨波,,刘希民,刘涤石;80386/486微机系统缓冲存贮器的硬件结构及其性能分析[J];山东建材学院学报;1994年03期
8 曾令将;王继红;舒红霞;;并行嵌入式系统可视化性能分析工具的设计与实现[J];计算机与数字工程;2012年03期
9 Sheraz Anjum;陈杰;;一种高效的指令缓存单元架构及其性能分析(英文)[J];电子器件;2007年05期
10 刘建华,焦丽梅,孟丹;Windows终端模式下NC服务器的性能分析[J];计算机应用;2004年03期
相关重要报纸文章 前3条
1 《网络世界》记者 蒙克;福禄克推出应用性能分析解决方案[N];网络世界;2013年
2 何亮;英特尔推性能分析器软件[N];中国计算机报;2003年
3 ;采用HT技术的P4 3.06GHz处理器的测试数据[N];电子资讯时报;2002年
相关博士学位论文 前1条
1 冯权友;大规模众核微处理器互连网络体系结构及性能分析研究[D];国防科学技术大学;2012年
相关硕士学位论文 前1条
1 周国建;龙芯嵌入式系统的性能分析与优化研究[D];中国石油大学;2008年
本文编号:1770984
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1770984.html