基于GPU的多波前稀疏Cholesky分解优化方法的研究
本文关键词:基于GPU的多波前稀疏Cholesky分解优化方法的研究
更多相关文章: 乔里斯基分解 多波前方法 多任务队列方案 任务分配 图形处理器
【摘要】:在大量的科学计算和工程应用中,稀疏线性方程组的求解是一个特别重要的部分,Cholesky分解因具有很高的性能且计算结果精确常用来分解大的稀疏线性方程组。过去,为了减少总的计算时间,有很多科研人员利用CPU集群分解稀疏矩阵。如今,随着图形处理器(Graphics Processing Unit,GPU)计算能力的快速提升,已有采用GPU加速稀疏线性方程组求解的方案。为了提升性能,这些方案把计算量大的操作分配给GPU处理,但因GPU编程模式的原因,这些方案往往无法充分利用GPU的计算资源。针对目前GPU处理稀疏线性方程组存在的问题,提出并实现了基于GPU的多波前稀疏Cholesky分解方法。多波前方法将一个大的稀疏矩阵分解为一系列小的稠密矩阵,然后再对这些稠密矩阵进行处理,在每个稠密矩阵的分解过程中,矩阵与矩阵的乘法(General Matrix-matrix Multiplication,GEMM)运算占据了绝大部分的计算时间,而且多个GEMM运算很难在GPU上并行执行,为了提升程序的性能,从三个角度对程序进行了优化。多任务队列方案用于在GPU的内核函数中同时执行多个GEMM操作,多个GEMM操作的计算时间以及数据传输的开销都能得到隐藏,减少了总的计算时间;为了使每个GEMM操作的处理时间都是最少的,设定一个阈值来决定GEMM操作的处理平台:如果某个GEMM操作涉及的计算量比该阈值大,就将其分配给GPU处理,否则分配给CPU处理;在GPU上利用多个线程块处理一个GEMM运算,同时,优化算法的执行流程来提升GEMM操作的性能。基于Linux操作系统和CUDA编程环境,采用4种测试方案在6组测试数据上进行了性能对比。实验结果表明:基于GPU的多波前稀疏Cholesky分解方法,与CPU实现的多线程Cholesky分解相比,加速比达到了3.15倍;同时,与现有的GPU加速方案相比,加速比达到了1.98倍。3种优化措施被应用于电力系统潮流计算中后,程序的性能也得到了明显的提升。
【关键词】:乔里斯基分解 多波前方法 多任务队列方案 任务分配 图形处理器
【学位授予单位】:华中科技大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:O241.6
【目录】:
- 摘要4-5
- Abstract5-9
- 1 绪论9-16
- 1.1 问题的提出9-10
- 1.2 课题背景与研究意义10-11
- 1.3 国内外研究现状11-14
- 1.4 研究内容14-15
- 1.5 本文结构框架15-16
- 2 多波前稀疏Cholesky分解方法的分析与设计16-26
- 2.1 多波前稀疏Cholesky分解的原理16-17
- 2.2 性能瓶颈分析17-20
- 2.3 多波前稀疏Cholesky分解的设计思路20-25
- 2.4 本章小结25-26
- 3 多波前稀疏Cholesky分解方法的优化26-40
- 3.1 多任务队列方案的设计26-33
- 3.2 CPU-GPU间的任务分配33-35
- 3.3 GPU上GEMM运算的优化35-38
- 3.4 本章小结38-40
- 4 系统测试与分析40-50
- 4.1 测试环境与方法40-41
- 4.2 整体性能测试41-45
- 4.3 CPU-GPU间矩阵分配的性能测试45-47
- 4.4 在电力系统潮流计算中的应用与测试47-48
- 4.5 本章小结48-50
- 5 总结与展望50-52
- 致谢52-54
- 参考文献54-58
- 附录1 攻读硕士期间发表的论文58-59
- 附录2 攻读硕士期间申请的国家发明专利59-60
- 附录3 攻读硕士期间参与的项目60
【相似文献】
中国期刊全文数据库 前10条
1 李玉梅;矩阵分块的几个重要应用[J];怀化师专学报;2000年02期
2 侯秋果;;矩阵分块的应用[J];科技信息(科学教研);2008年13期
3 纪坤;陈建平;石振国;刘维富;;矩阵三角分解分块算法的研究与实现[J];计算机应用与软件;2010年09期
4 长日;矩阵分块法的应用[J];福清师专学报;1981年00期
5 陆余楚,朱文兴;矩阵的分块、零化与摄动[J];工科数学;1986年03期
6 黄廷祝,游兆永;矩阵的G-分块对角占优性[J];工程数学学报;1993年03期
7 徐道义;;区间矩阵的稳定性[J];自然杂志;1988年05期
8 金基平;电场问题优化的矩阵分块解法[J];高压电器;1991年05期
9 李源;黄辉;郝小枝;;计算矩阵高次方幂的几种方法[J];云南大学学报(自然科学版);2008年S2期
10 J.E.克雷尔伯特;;地球物理资料处理基础[J];石油地球物理勘探;1978年05期
中国重要会议论文全文数据库 前2条
1 支希哲;孟光;顾致平;;稳定性判定阵的分块确定法[A];1995中国控制与决策学术年会论文集[C];1995年
2 吴柏生;李正光;;结构布局修改的重分析方法[A];第九届全国结构工程学术会议论文集第Ⅱ卷[C];2000年
中国博士学位论文全文数据库 前3条
1 黄泽军;关于矩阵组合分析性质的若干结果[D];华东师范大学;2011年
2 沈长鹏;订单结构与拣选系统的适配问题研究[D];山东大学;2011年
3 申淑谦;特殊矩阵数值分析和鞍点问题迭代求解预处理技术[D];电子科技大学;2008年
中国硕士学位论文全文数据库 前10条
1 陈磊;面向多核DSP的高性能并行BLAS3的设计与实现[D];国防科学技术大学;2013年
2 曾侃圢;基于电阻矩阵定位原理的溃坝模型试验测量技术研究[D];重庆交通大学;2015年
3 赵祥宇;基于Spark平台的大矩阵LU分解及求逆算法的研究与实现[D];北京交通大学;2016年
4 王伟;基于GPU的多波前稀疏Cholesky分解优化方法的研究[D];华中科技大学;2015年
5 刘真;基于用户评分矩阵分块的鲁棒推荐模型研究[D];燕山大学;2013年
6 黄荣;几类分块组合选取因子法的非奇H-矩阵判定[D];湘潭大学;2005年
7 符和满;符号空间一类稠密混沌系统的矩阵刻画[D];华南师范大学;2005年
8 楼Z蟍;M-矩阵等特殊矩阵及其特殊积[D];陕西师范大学;2004年
9 杜翠真;五阶完全正矩阵[D];安徽大学;2005年
10 陈一昭;并行计算在矩阵运算中的应用[D];昆明理工大学;2011年
,本文编号:985146
本文链接:https://www.wllwen.com/kejilunwen/yysx/985146.html