有限元网格积分算法在MIC众核平台上的并行实现
本文选题:集成众核 + 卸载模式 ; 参考:《计算机科学》2015年11期
【摘要】:基于英特尔集成众核(Many Integrated Core,MIC)架构,将有限元网格积分算法在至强融核(Xeon Phi)协处理器做了移植和性能分析。该应用全面测试了有限元分析的核心计算过程在MIC上的加速效果,实现了卸载模式(offload)[1]下利用OpenMP在MIC上的线程并行化。计算性能测试结果显示集成众核平台可以有效地加速有限元网格积分算法:1)一块被充分利用的MIC设备卡(3115A)的计算能力超过两路16核Intel XeonTM E5-2670CPU;2)MIC并发的物理线程可能由于公共缓存访问存在竞争而降低程序的扩展性。测试结果还显示了在多CPU多MIC平台上进一步移植完整的MPI并行有限元模拟软件的可行性。这项工作有助于推动与有限元网格相关的科学和工程高性能计算的研究。
[Abstract]:Based on the Many Integrated Core (MIC) architecture, the finite element mesh integration algorithm has been transplanted and performance analyzed in the most strong fusion kernel (Xeon Phi) coprocessor. The application tests the acceleration effect of the core calculation process of the finite element analysis on MIC and realizes the use of OpenMP in MIC under the unloading mode (offload) [1]. The results of the computational performance test show that the integrated public kernel platform can effectively accelerate the finite element mesh integration algorithm: 1) a fully utilized MIC device card (3115A) has more computing power than two 16 core Intel XeonTM E5-2670CPU; 2) MIC concurrent physical threads may be reduced due to the competition of public cache access. The test results also show the feasibility of further transplantation of the complete MPI parallel finite element simulation software on multiple CPU multiple MIC platforms. This work helps to promote the research of scientific and engineering high performance computing related to the finite element grid.
【作者单位】: 上海超级计算中心;埃克塞特大学数学系;
【基金】:国家高技术研究发展计划(863)(2012AA01A308) 国家自然科学基金(11473014) 上海市科学技术委员会科研计划项目(13DZ2294500)资助
【分类号】:O241.82;TP338.6
【参考文献】
相关期刊论文 前4条
1 王迎瑞;任江勇;田荣;;基于GPU的高性能稀疏矩阵向量乘及CG求解器优化[J];计算机科学;2013年03期
2 沈铂;张广勇;吴韶华;卢晓伟;张清;;基于MIC平台的offload并行方法研究[J];计算机科学;2014年S1期
3 刘跃进;薛孟君;;LDLT分块求解计算方法在有限元分析中的编程实现[J];计算机科学;2014年S2期
4 刘建华;王朝尉;任江勇;田荣;;面向异构架构的混合精度有限元算法及其CUDA实现[J];计算机科学;2012年06期
【共引文献】
相关期刊论文 前2条
1 阳王东;李肯立;石林;;一种准对角矩阵的混合压缩算法及其与向量相乘在GPU上的实现[J];计算机科学;2014年07期
2 方宝辉;徐金秀;魏敏;周明忠;;BCC_AGCM_T106在Intel众核上混合异构编程与优化研究[J];计算机科学与探索;2015年09期
相关博士学位论文 前2条
1 杨蒙召;人体面部真实感快速渲染方法研究[D];哈尔滨工业大学;2014年
2 冯晓文;基于GPU的相似度计算关键技术研究[D];华中科技大学;2014年
相关硕士学位论文 前1条
1 赵仙勇;基于区域分解法的铝电解槽电场有限元分析并行计算研究[D];中南大学;2013年
【二级参考文献】
相关期刊论文 前1条
1 唐天兵;谢祥宏;申文杰;韦凌云;严毅;;多核CPU环境下的并行遗传算法的研究[J];广西大学学报(自然科学版);2009年04期
【相似文献】
相关期刊论文 前10条
1 吴淑芳,王艳春;有限元网格造型系统[J];长春光学精密机械学院学报;1998年01期
2 罗特军,罗季军,汪榴;有限元网格优化方法[J];四川联合大学学报(工程科学版);1999年03期
3 刘爱荣,曹中清,周本宽;一种自动划分三维有限元网格的新方法[J];西南交通大学学报;1997年03期
4 严登俊,黄学良,胡敏强;二维平面任意区域有限元网格自适应生成算法[J];微电机(伺服技术);1999年03期
5 孔德清;一种特殊设计约束面的有限元网格优化问题[J];力学与实践;2001年02期
6 陈立岗;郑耀;陈建军;;全四边形有限元网格的拓扑优化策略[J];计算机辅助设计与图形学学报;2007年01期
7 高峰;武殿梁;程奂,
本文编号:1958787
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1958787.html