当前位置:主页 > 科技论文 > 计算机论文 >

GPU集群加速近似逆预条件CG并行求解器

发布时间:2018-12-18 20:27
【摘要】:针对GPU集群系统,研究了分解近似逆(approximate inverse,AINV)和对称逐次超松弛-近似逆(symmetric successive over relaxation approximate inverse,SSOR-AI)两类近似逆预条件的并行算法。采用多级k-路图划分方法,通过子图的内点和边界点识别方法以及稀疏矩阵的置换技术,提出了将稀疏矩阵转换为分块箭形矩阵的并行方法。基于所形成的分块箭形矩阵,结合块内稀疏矩阵近似逆串行、块间并行的策略给出了近似逆预条件的并行方法,实现了AINV和SSOR-AI并行算法,解决了AINV预条件难以并行的问题。基于CPU与GPU协同计算、主机端页锁定内存和设备端计算与通信重叠的优化技术,实现了并行近似逆预条件与共轭梯度(conjugate gradient,CG)算法相结合的线性方程组混合并行求解器。数值实验表明,所提方法对AINV和SSOR-AI两类近似逆预条件,在多GPU上获得了很好的可扩展性和加速效果。
[Abstract]:For GPU cluster systems, parallel algorithms for decomposing approximate inverse (approximate inverse,AINV) and symmetric successive overrelaxation approximate inverse (symmetric successive over relaxation approximate inverse,SSOR-AI (symmetric successive over relaxation approximate inverse,SSOR-AI) are studied. A parallel method of converting sparse matrix into block quiver matrix is proposed by using the method of multi-level k-path graph partition, the method of identifying interior and boundary points of subgraph and the technique of replacing sparse matrix. Based on the block quiver matrix, the parallel method of approximate inverse precondition is given by combining the strategy of approximate inverse serial and inter-block parallelism of sparse matrix in block. The parallel algorithm of AINV and SSOR-AI is realized, and the problem that AINV precondition is difficult to parallel is solved. Based on the cooperative computation of CPU and GPU, the optimization technique of memory locking on the host side and the overlap of computing and communication on the device side, a hybrid parallel solver for linear equations is implemented, which combines the parallel approximate inverse precondition with the conjugate gradient (conjugate gradient,CG) algorithm. Numerical experiments show that the proposed method can achieve good scalability and acceleration on multiple GPU for two kinds of approximate inverse preconditioners: AINV and SSOR-AI.
【作者单位】: 中国科学院计算机网络信息中心;中国科学院大学;
【基金】:国家重点基础研究发展计划(973计划)No.2011CB309702 数学工程与先进计算国家重点实验室开放基金No.2014A03~~
【分类号】:TP338.6

【共引文献】

相关期刊论文 前4条

1 赵宁;秦策;徐玉聪;;拟极小残差法在GPU上的优化研究[J];科学技术与工程;2014年07期

2 李佳佳;张秀霞;谭光明;陈明宇;;选择稀疏矩阵乘法最优存储格式的研究[J];计算机研究与发展;2014年04期

3 陈尧;赵永华;赵慰;赵莲;;GPU加速不完全Cholesky分解预条件共轭梯度法[J];计算机研究与发展;2015年04期

4 郑汉垣;;GaBP算法优化与实现[J];龙岩学院学报;2015年02期

相关博士学位论文 前8条

1 张芡;大规模稀疏线性系统的稀疏近似逆预处理技术[D];清华大学;2013年

2 王艳广;伽辽金多极边界元法及其在声学中的应用[D];湖南大学;2013年

3 姚路;图分割算法及其在大规模数值并行计算中的应用研究[D];国防科学技术大学;2013年

4 张珂良;单GPU及GPU异构集群的若干关键技术研究[D];复旦大学;2013年

5 郑汉垣;大规模稀疏线性方程组求解的并行GaBP算法研究[D];上海大学;2014年

6 胡子翔;塑料注射成形模拟中方程组的高效求解方法[D];华中科技大学;2014年

7 冯晓文;基于GPU的相似度计算关键技术研究[D];华中科技大学;2014年

8 穆帅;针对不规则应用的图形处理器资源调度关键技术研究[D];清华大学;2013年

【相似文献】

相关期刊论文 前10条

1 杨晟院;肖映雄;舒适;钟柳强;;高次有限元方程的一种并行预条件子[J];系统仿真学报;2008年22期

2 吴建平;王正华;李晓梅;;二维三温能量方程组的预条件迭代软件包研制——离散所得稀疏线性方程组的求解[J];计算机工程与应用;2007年33期

3 沈海龙;邵新慧;张铁;李长军;;H-矩阵方程组的预条件迭代法[J];数值计算与计算机应用;2009年04期

4 李磊,张玉,谢拥军,梁昌洪;"邻居单元"为基础的预条件方法及其应用[J];电子与信息学报;2005年03期

5 吴建平,王正华,李晓梅;块三对角矩阵的并行局部块分解预条件[J];计算机学报;2005年03期

6 张占龙;邓军;朱祯海;肖冬萍;李德文;胡强;何为;郭伟;;电场计算的快速多极子预条件高阶边界元法[J];重庆大学学报;2011年06期

7 吴建平,李晓梅;三维问题的局部块分解预条件[J];计算物理;2003年01期

8 吴建平;张理论;马怀发;宋君强;张卫民;;排序对重叠区域分解型并行ILU的影响分析[J];计算机工程与应用;2012年33期

9 梁莉;李月卉;;求解电磁场边值问题有限元线性系统的新型预条件算法[J];电脑知识与技术;2013年29期

10 吴建平,李晓梅;块三对角矩阵局部块分解及其在预条件中的应用[J];计算机学报;2002年08期

相关会议论文 前10条

1 梅金顺;刘洪;;预条件方程组及其应用[A];中国科学院地质与地球物理研究所二○○四学术论文汇编·第三卷(油气·矿产·水资源)[C];2004年

2 刘喜武;刘洪;;实现稀疏反褶积的预条件双共轭梯度法[A];中国科学院地质与地球物理研究所二○○三学术论文汇编·第四卷(油气资源)[C];2003年

3 柯涛;丁建军;丁大志;樊振宏;陈如山;;特征谱双步预条件结合多分辨预条件技术快速分析电磁散射问题[A];2007年全国微波毫米波会议论文集(上册)[C];2007年

4 丁大志;王晨;张清荣;陈如山;;加速多层快速多极子的近区迭代预条件方法的应用(英文)[A];2005'全国微波毫米波会议论文集(第一册)[C];2006年

5 霍志周;熊登;张剑锋;;预条件共轭梯度法在地震数据重建方法中的应用[A];中国科学院地质与地球物理研究所2013年度(第13届)学术论文汇编——油气资源研究室[C];2014年

6 姜兆能;陈如山;陈华;樊振宏;丁大志;;多分辨预条件结合混合形式快速多极子算法分析低频散射问题[A];2009年全国微波毫米波会议论文集(下册)[C];2009年

7 肖映雄;陈鹏;舒适;;两类网格结构模型的预处理方法[A];中国计算力学大会'2010(CCCM2010)暨第八届南方计算力学学术会议(SCCM8)论文集[C];2010年

8 董健;柴舜连;毛钧杰;;预条件技术和迭代算法在高效实现MLFMA中的对比研究[A];2005'全国微波毫米波会议论文集(第三册)[C];2006年

9 赵延文;张雪峰;陆田;杨颖怡;;矩阵预条件技术在时域积分方程MOT算法中的应用[A];2009年全国天线年会论文集(上)[C];2009年

10 阙肖峰;聂在平;;一类基于MLFMA的分组稀疏近似逆预条件技术[A];2009年全国天线年会论文集(上)[C];2009年

相关博士学位论文 前10条

1 李正光;结构布局修改静力重分析的预条件共轭梯度法[D];吉林大学;2004年

2 张勇;线性方程组预条件技术及在二维三温问题中的应用和实现[D];电子科技大学;2008年

3 任志刚;预条件算法及在电磁场数值模拟中的应用[D];电子科技大学;2010年

4 李月卉;电磁场数值求解中迭代方法与预条件技术研究[D];电子科技大学;2011年

5 张振宇;数值线性代数中的若干问题[D];复旦大学;2003年

6 沈海龙;线性代数系统迭代解法与预条件方法研究[D];东北大学;2013年

7 王瑞瑞;求解某些特殊稀疏线性系统的数值解法[D];厦门大学;2009年

8 程光辉;大型稀疏线性代数系统迭代解法研究[D];电子科技大学;2008年

9 刘春梅;几种求解H(curl)与H(grad)型偏微分方程有限元离散系统的多水平快速算法[D];湘潭大学;2012年

10 陈明;并行多层快速多极子算法加速技术的研究[D];南京理工大学;2012年

相关硕士学位论文 前10条

1 刘金妮;近似逆预条件子的研究[D];电子科技大学;2009年

2 谭林;两类典型微分方程离散化系统的预条件子研究[D];湘潭大学;2006年

3 赵海燕;线性系统的预条件解法[D];扬州大学;2008年

4 徐锦秋;解一类微分方程的预条件方法的收敛性[D];扬州大学;2009年

5 江跃勇;块三对角矩阵的不完全分解预条件方法[D];电子科技大学;2007年

6 徐森林;求解二阶混合有限体元离散系统的高效预条件子[D];湘潭大学;2011年

7 韦亮;确定加权多分裂预条件子的三个极小化模型[D];太原理工大学;2012年

8 李进阳;复杂目标电磁建模及预条件加速技术研究[D];南京理工大学;2013年

9 周少博;大型线性方程组不完全分解预条件方法的研究[D];电子科技大学;2008年

10 王卫芳;线性方程组的预条件迭代解法及其比较性定理[D];陕西师范大学;2008年



本文编号:2386454

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2386454.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户7bf9e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com