GPU加速的矩阵计算的研究
本文关键词:GPU加速的矩阵计算的研究
更多相关文章: 矩阵最大特征值 可逆矩阵逆矩阵 CUDA GPU
【摘要】:高性能计算领域的很多问题都在研究并行算法的实现,而矩阵计算又是高性能计算中应用非常广泛的内容。随着需求的日益增加,串行算法已经无法满足研究的需求,集群会有部分性能的提升,但是集群低耦合的局限性导致它的可移植性差,计算量增加带来了高昂的设备成本和大的耗电量。图形处理器GPU(Graphic Process Unit)有着强大的并行处理能力,出色的浮点计算能力,大存储带宽和低成本,广泛用于求解大规模矩阵计算问题上。本文针对三个典型的矩阵问题进行研究:正矩阵近似最大特征值,普通矩阵近似最大特征值和可逆矩阵求逆矩阵。首先目前求解正矩阵近似最大特征值问题最有效的算法是串行实现的,本文在CUDA架构下实现了相似变换方法求解正矩阵的最大特征值的并行算法(PA-ST:Parallel-Similarity Transformation),取得了30.028的最大加速比。其次目前求解一般矩阵近似最大特征值的并行QR算法更适用于求出矩阵所有特征值。因此我们借助于CUDA架构实现了求解普通矩阵的近似最大特征值的并行加速(PA-A:Pareallel-Approximate)。获得的加速比范围是为15.424~101.714。最后对于可逆矩阵求逆矩阵问题,目前有效的算法都是串行思想。随着矩阵规模的增加,串行方法的计算无疑是非常耗时的。考虑到上面的情况,本文首次实现了全选主元高斯约旦法求实矩阵逆矩阵的GPU并行算法(PA-Gauss For Real Matrix)和复矩阵逆矩阵的的GPU并行算法(PA-Gauss For Complex Matrix)。分别获得了100435和36508的最大加速比。我们对算法核心步骤进行并行化,并且做了相应的CUDA优化。实验结果均表明在矩阵大小持续变大的情况下,加速比也跟着对应的上升,而迭代不断加大的情况下我们的加速比并没有什么明显的变化,因此我们的算法对于更大规模矩阵的迭代问题仍然有效。
【学位授予单位】:黑龙江大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP38
【相似文献】
中国期刊全文数据库 前10条
1 刘晓平;王启骏;陈皓;张乃钊;;基于距离的点光源软阴影GPU生成方法[J];合肥工业大学学报(自然科学版);2011年12期
2 郭云;康涛;徐涵;;基于优化存储的嵌入式GPU的字符显示[J];计算机系统应用;2012年10期
3 本刊编辑部;;加州大学圣地亚哥分校使用GPU超级计算机实现千万亿次级地震模拟[J];科研信息化技术与应用;2013年02期
4 陆筱霞;段光明;李思昆;;基于GPU的遥感纹理压缩解压算法[J];系统仿真学报;2009年S1期
5 詹总谦;卢亮;;基于GPU并行处理技术的影像畸变差修正[J];测绘信息与工程;2011年02期
6 许建;林泳;秦勇;黄翰;;基于GPU的并行协同过滤算法[J];计算机应用研究;2013年09期
7 技术宅;;GPU通用计算解密[J];电脑爱好者;2014年02期
8 张浩;李利军;林岚;;GPU的通用计算应用研究[J];计算机与数字工程;2005年12期
9 AZ521;;GPU的革命 解析通用计算技术[J];电脑迷;2009年15期
10 丁鹏;贾月乐;张静;张岩;;GPU结构与通用计算探析[J];技术与市场;2009年09期
中国重要会议论文全文数据库 前4条
1 夏青;岳利群;;基于GPU编程的海浪仿真技术研究[A];2007系统仿真技术及其应用学术会议论文集[C];2007年
2 刘小虎;胡耀国;符伟;;大规模有限元系统的GPU加速计算研究[A];中国计算力学大会'2010(CCCM2010)暨第八届南方计算力学学术会议(SCCM8)论文集[C];2010年
3 张迪;黄伟;罗琦;王侃;;波形板干燥器内液滴数值模拟的GPU并行加速[A];第十六届全国流体力学数值方法研讨会2013论文集[C];2013年
4 李慧;付志一;;基于GPU计算的有限元总刚组成方法探索[A];北京力学会第17届学术年会论文集[C];2011年
中国重要报纸全文数据库 前7条
1 本报记者 刘燕;GPU加速是手机浏览器方向[N];科技日报;2012年
2 ;GPU,智能手机好推手[N];电脑报;2013年
3 诸玲珍;NVIDIA推0.13微米GPU[N];中国电子报;2002年
4 网络世界记者 周源;曙光三款GPU服务器问世[N];网络世界;2013年
5 小溪 编译;NVIDIA唱响GPU统一架构时代序曲[N];计算机世界;2006年
6 ;GPU市场Q2创八年最大增幅[N];计算机世界;2009年
7 沈阳 刘镝;GPU:给显卡一颗驿动的“芯”[N];电脑报;2001年
中国博士学位论文全文数据库 前4条
1 陈钢;众核GPU体系结构相关技术研究[D];复旦大学;2011年
2 白洪涛;基于GPU的高性能并行算法研究[D];吉林大学;2010年
3 刘华海;节点内多CPU多GPU协同并行绘制关键技术研究[D];国防科学技术大学;2012年
4 林一松;面向GPU的低功耗软件优化关键技术研究[D];国防科学技术大学;2012年
中国硕士学位论文全文数据库 前10条
1 李佳功;基于GPU的脉冲星相干消色散技术的研究和应用[D];昆明理工大学;2015年
2 刘园园;基于GPU的颗粒增强复合材料损伤演化的宏细观跨尺度模拟[D];昆明理工大学;2015年
3 李璐;基于GPU的并行SVM算法的改进及其应用[D];南京信息工程大学;2015年
4 梅世冬;实时阴影绘制方法研究及GPU加速[D];华中师范大学;2010年
5 李军;基于GPU的大规模场景实时阴影绘制[D];湖南大学;2011年
6 韦婷;基于GPU的自然场景渲染优化技术研究[D];广西大学;2013年
7 晏福兴;基于GPU的软阴影技术的研究[D];杭州电子科技大学;2009年
8 明星;基于GPU的医学图像三维重建算法及其应用[D];华中科技大学;2009年
9 马鸣飞;基于GPU加速的三维超声成像系统[D];哈尔滨工业大学;2011年
10 李茂前;基于GPU加速的光子映射渲染算法研究与实现[D];浙江工商大学;2015年
,本文编号:1195829
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1195829.html