大规模3D并行分层可扩展矩阵乘法的递阶优化方法
[Abstract]:In order to improve the parallel computing efficiency of scalable matrix multiplication on large-scale platforms, a hierarchical optimization method for parallel hierarchical scalable matrix multiplication is proposed. Firstly, on the basis of the research on the communication between pivot row and pivot row of (SMM) algorithm, the grid is divided into rectangular groups at a higher level by using hierarchical method, and the two-dimensional computation of matrix multiplication is transformed into three-dimensional computation, which is based on the research of the communication between pivot row and pivot row of the extended matrix multiplication algorithm. The corresponding intra-cluster communication and inter-cluster communication process are designed, and the hierarchical parallel optimization (HSMM); for SMM multiplication is realized. Secondly, the proposed HSMM algorithm is analyzed theoretically, and the communication cost is analyzed and predicted according to the situation, and the optimal selection method of cluster number is deduced. Finally, experiments on Grid5000 and BlueGene/P test platform show that the proposed algorithm is superior to the contrast algorithm in terms of execution time and communication time. The validity of the proposed algorithm and the correctness of the theoretical analysis are verified.
【作者单位】: 中山火炬职业技术学院信息工程系;广东外语外贸大学思科信息学院;
【分类号】:TP338.6
【参考文献】
相关期刊论文 前2条
1 徐传福;车永刚;王正华;彭宇行;;一种均衡可扩展计算机体系结构分布式模拟方法[J];软件学报;2014年08期
2 李文明;叶笑春;张洋;宋风龙;王达;唐士斌;范东睿;谢向辉;;BDSim:面向大数据应用的组件化高可配并行模拟框架[J];计算机学报;2015年10期
【共引文献】
相关期刊论文 前7条
1 赵嗣然;;计算机体系结构软件模拟技术[J];电子制作;2015年06期
2 郑刚;;计算机体系结构软件模拟技术应用研究[J];信息与电脑(理论版);2016年07期
3 冯卫刚;;数据结构、算法和程序之间关系研究[J];四川水泥;2016年09期
4 黄永飞;;计算机体系结构软件模拟技术分析[J];自动化与仪器仪表;2016年10期
5 何书鸾;;计算机体系结构软件模拟技术研究[J];电脑知识与技术;2017年04期
6 方国庆;李文明;余洋;张洋;叶笑春;安虹;;高通量众核并行模拟加速技术研究[J];计算机工程;2017年04期
7 卢炼;阳爱民;;大规模3D并行分层可扩展矩阵乘法的递阶优化方法[J];计算机应用研究;2017年06期
【二级参考文献】
相关期刊论文 前8条
1 高翔;张福新;汤彦;章隆兵;胡伟武;唐志敏;;基于龙芯CPU的多核全系统模拟器SimOS-Goodson[J];软件学报;2007年04期
2 张福新;章隆兵;胡伟武;;基于SimpleScalar的龙芯CPU模拟器Sim-Godson[J];计算机学报;2007年01期
3 喻之斌;金海;邹南海;;计算机体系结构软件模拟技术[J];软件学报;2008年04期
4 严强;张为华;刘力力;臧斌宇;朱传琪;;一种基于元数据的采样模拟技术优化[J];计算机学报;2008年11期
5 黄永勤;李宏亮;谢向辉;钱磊;郝子宇;过锋;张昆;;ArchSim:A System-Level Parallel Simulation Platform for the Architecture Design of High Performance Computer[J];Journal of Computer Science & Technology;2009年05期
6 焦帅;徐卫志;唐士斌;范东睿;孙凝晖;;PartitionSim:一个面向众核结构的并行模拟器[J];计算机学报;2011年11期
7 刘轶;支予哲;张昕;李鹤;焦林;张鹏;苏阳明;倪泽辉;钱德沛;;SimHPC:一种基于执行驱动的大规模并行系统模拟器[J];计算机学报;2013年04期
8 王元卓;靳小龙;程学旗;;网络大数据:现状与展望[J];计算机学报;2013年06期
【相似文献】
相关期刊论文 前10条
1 李晓平;矩阵乘法——2000年第7期擂台赛题解[J];电脑爱好者;2000年13期
2 吴猛;刘振;;基于并行存储优化的矩阵乘法运算[J];电脑知识与技术;2010年03期
3 吴志川;毛琛;韩蕾;陈立军;;高度可伸缩的稀疏矩阵乘法[J];计算机科学与探索;2013年11期
4 谢林川;;矩阵乘法的优化[J];才智;2013年16期
5 李梅;;光学向量矩阵乘法实验研究[J];计算机技术与发展;2012年03期
6 李梅;;光学向量矩阵乘法研究[J];计算机技术与发展;2012年02期
7 陈增荣;;复矩阵乘法的并行计算[J];计算机工程与科学;1981年01期
8 钱秋明,李庆熊,赵建明,王之江;光学全并行矩阵乘法[J];中国激光;1991年07期
9 齐景嘉;夏丽华;;并行矩阵乘法算法的研究[J];黑龙江大学自然科学学报;2006年03期
10 姜建国,赵元哲,罗笑南;3~n阶矩阵乘法的分块算法[J];西安电子科技大学学报;1995年04期
相关会议论文 前2条
1 何红旗;邵仪;蒋烈辉;赵秋霞;;矩阵乘法的FPGA并行设计与实现[A];计算机研究新进展(2010)——河南省计算机学会2010年学术年会论文集[C];2010年
2 焦海澎;钱立敏;;利用进程环模拟矩阵的并行算法[A];天津市土木工程学会第七届年会优秀论文集[C];2005年
相关博士学位论文 前1条
1 殷建;基于GPU的矩阵乘法优化研究[D];山东大学;2015年
相关硕士学位论文 前10条
1 贾坤;云环境下大型矩阵乘法的安全外包方案研究[D];电子科技大学;2016年
2 陈雪;基于DataMPI的并行矩阵乘法计算模型研究[D];上海大学;2016年
3 柯善学;有限域上单变元多项式分解的研究及矩阵乘法指数的改进[D];中国人民解放军信息工程大学;2003年
4 邓生杰;2x2快速矩阵乘法问题的完全求解[D];华南理工大学;2011年
5 何怡芝;基于集群环境的矩阵乘法算法的研究与设计[D];西北大学;2013年
6 胡海平;基于群论的矩阵乘法问题的搜索算法[D];华南理工大学;2015年
7 赵金鹏;基于MPI的矩阵乘法效率研究[D];成都理工大学;2013年
8 曾咏涛;基于YHFT-Matrix的MIMO-OFDM系统关键算法的设计与实现[D];国防科学技术大学;2012年
9 梁娟娟;基于GPU的BLAS库的设计和实现[D];中国科学技术大学;2010年
10 张锐;光学向量—矩阵乘法器实验研究[D];国防科学技术大学;2006年
,本文编号:2454159
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2454159.html