异构平台中并行矩量法的加速技术
本文选题:矩量法 + 异构平台 ; 参考:《微波学报》2014年S1期
【摘要】:本文主要研究了在CPU/GPU异构集群上的并行矩量法的加速技术。本文设计出一种MPI/CUDA软件编程架构,解决了CPU/GPU异构集群上并行LU分解跨节点计算的难题。此架构基于矩阵分块二维循环分布的数据分配策略,利用MPI实现计算节点之间的通信,同时利用GPU加速矩阵更新过程。为了突破GPU显存对LU分解的矩阵规模的限制,本文进一步研究了"显存—内存"核外算法。为了优化算法性能,本文提出了基于"CUDA流"技术和"异步通信"技术的设计方案,实现了GPU通信与计算的重叠,有效隐藏了GPU通信时间,获到了明显的加速效果。
[Abstract]:This paper mainly studies the acceleration technique of parallel mom on CPU / GPU heterogeneous clusters. In this paper, a MPI / CUDA software programming architecture is designed to solve the problem of parallel LU decomposition across nodes on CPU / GPU heterogeneous clusters. Based on the data allocation strategy of matrix block two-dimensional cyclic distribution, MPI is used to realize the communication between computing nodes, and GPU is used to accelerate the matrix updating process. In order to break through the limitation of GPU memory on the matrix size of LU decomposition, this paper further studies the "memory" out-of-core algorithm. In order to optimize the performance of the algorithm, this paper proposes a design scheme based on "CUDA stream" technology and "asynchronous communication" technology, which realizes the overlap of GPU communication and computation, effectively hides the GPU communication time, and achieves obvious acceleration effect.
【作者单位】: 西安电子科技大学电子工程学院;
【分类号】:TP332;TP338.6
【参考文献】
相关期刊论文 前1条
1 马韬;陈明生;吴先良;刘艺;齐琪;;基于GPU加速的高阶矩量法研究与应用[J];微波学报;2013年04期
【共引文献】
相关期刊论文 前10条
1 王恺;刘民选;艾海滨;张力;;基于GPU的快速影像匹配[J];测绘科学;2014年02期
2 刘鹏;何雯;肖巍巍;;基于GPGPU技术快速提取数字表面模型[J];测绘地理信息;2014年02期
3 朱Ym;;基于CUDA的三维数据场可视化加速技术研究[J];常熟理工学院学报;2014年02期
4 袁峰;李晓晖;张明明;周涛发;高道明;洪东良;刘晓明;汪启年;朱将波;;隐伏矿体三维综合信息成矿预测方法[J];地质学报;2014年04期
5 唐任远;吴东阳;谢德馨;;单元级别并行有限元法求解工程涡流场的关键问题研究[J];电工技术学报;2014年05期
6 洪亮;周松涛;罗伊;石婷婷;胡飞;;海量遥感数据的GPU通用加速计算技术[J];地理空间信息;2014年03期
7 尤晶晶;王韶霞;;浅谈优化图像压缩的算法技术实现[J];河北民族师范学院学报;2014年02期
8 李杰;刘灏;常磊;;高速数据采集曲线的快速绘制方法[J];电脑编程技巧与维护;2014年19期
9 孔浩;刘金义;;基于GPGPU的离散数据挖掘研究[J];电子设计工程;2014年18期
10 李杰;刘灏;马恩财;刘明锋;;基于GPU的JPEG压缩算法实现[J];电脑知识与技术;2014年26期
相关博士学位论文 前10条
1 张知竹;三维特征线方法的并行与加速方法研究[D];清华大学;2013年
2 贾海鹏;面向GPU计算平台的若干并行优化关键技术研究[D];中国海洋大学;2012年
3 宁江凡;破碎的图形建模与绘制技术研究[D];国防科学技术大学;2013年
4 张勇;固体非均匀混合介质频域介电特性测量理论与方法研究[D];长安大学;2014年
5 崔树林;基于GPU的并行矢量数据分析与索引技术研究[D];中国科学院研究生院(东北地理与农业生态研究所);2014年
6 王东凯;浅海OBC资料自由表面多次波压制方法研究[D];中国海洋大学;2014年
7 袁健美;多贝西小波密度泛函的并行算法及其应用[D];湘潭大学;2014年
8 林义闽;未知环境中智能机器人的视觉导航技术研究[D];北京邮电大学;2014年
9 陈湘骥;基于多尺度相似学习的图像超分辨率重建算法研究[D];华南理工大学;2014年
10 任超锋;航空视频影像的正射影像制作关键技术研究[D];武汉大学;2014年
相关硕士学位论文 前10条
1 王子丹;基于遗传算法的可逆逻辑综合方法及其CUDA并行化实现[D];东华大学;2014年
2 余列祥;基于GPU加速的边界面法的研究[D];湖南大学;2013年
3 赵权;激光间接驱动靶丸辐射对称性GPU并行算法研究[D];华中科技大学;2013年
4 陈明龙;基于CUDA蛋白质结构比对算法的优化研究[D];华中科技大学;2013年
5 杨赛勇;基于CUDA加速的并行人脸检测[D];华中科技大学;2013年
6 蒋维;基于CUDA的红外小目标检测算法的快速实现[D];华中科技大学;2013年
7 李林;基于CUDA的视频图像文字检测与去除研究[D];华中科技大学;2013年
8 张平;基于CUDA的TLD视觉跟踪算法研究[D];北京交通大学;2014年
9 吴磊;基于CUDA的红外图像处理算法设计[D];华中科技大学;2013年
10 邓巍;基于GPU的视频监控数据检测技术研究[D];华中科技大学;2013年
【二级参考文献】
相关期刊论文 前2条
1 张庆科;杨波;王琳;朱福祥;;基于GPU的现代并行优化算法[J];计算机科学;2012年04期
2 杜子静;张玉;赵勋旺;梁昌洪;;并行高阶矩量法分析舰队RCS和其它电磁特性[J];微波学报;2011年04期
【相似文献】
相关期刊论文 前2条
1 张玉,王萌,梁昌洪,谢拥军;PC集群系统中MPI并行矩量法研究[J];电子与信息学报;2005年04期
2 ;[J];;年期
,本文编号:2075387
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2075387.html