面向GPU的并行稀疏对角矩阵矢量乘算法研究及应用
【学位授予单位】:南京师范大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP301.6;TP332
【图文】:
随着通用图形处理单兀(Graphics邋Processing邋Unit,邋GPU)编程模型和开逡逑发工具链的成熟,GRJ给通用计算,特别是高性能计算带来了前所未有的机遇。GPU逡逑的设计理念与CPU有很大不同如图1.1所示。在GPU中,绝大部分资源用于计逡逑算,当前,GPU的计算能力和带宽都比CPU高出一个数量级,主流GPU的计算能逡逑力已达到6T0PS,存储带宽达到500GB/S。因此本论文的运算都是面向GPU架构的。逡逑II邋|i逦U邋I邋I邋I邋I邋I邋I邋I邋I邋i邋1邋I邋I邋ITT1逡逑逦u逦I邋I逦M逦I逦I逦I邋I逦M逦[逦i逦rm逡逑II逦U逦II逦I邋I逦I逦I逦11逦1邋I逦I逦I逦I邋il邋i逡逑逦IL逦逦邋u逦i邋i逦i邋I逦i逦I逦m逦i邋i逦i逦i逦i ̄m逡逑逦邋M邋I邋li邋II邋I邋I邋II邋II邋I邋II邋II逡逑0控制调节器逦brf丨!丨!邋!邋!邋!丨」I邋i丨丨.llj逡逑,__逦bi邋II邋1邋i邋1邋II邋1邋I邋I邋I邋1邋ITT1逡逑^邋木逻辑单兀邋逦-逦-逦U邋M邋I邋il邋II邋I邋11邋I邋11邋11邋1逡逑缓存逦逦逦逦逡逑?邋DRAM逡逑CPU逦GPU逡逑图1.1邋CPU和GPU的体系结构逡逑稀疏对角矩阵是一种特殊的稀疏矩阵,它的非零元素集中在少量的对角线上。且逡逑在许多领域有着广泛的应用。例如,在计算流体力学和电磁学等领域中的许多问题,逡逑采用有限差分法(Finite邋Difference邋Method
DIA邋(HDI)格式来减少零元素的填充。在HDI格式中,原始矩阵被划分成若干个具逡逑有相同行数量的矩阵块,且每个独立矩阵块采用DIA格式存储。由于DIA格式的使逡逑用,HDI格式无法解决矩阵中对角线存在偏移的情况。综合上述研宄来看,对于图1.2逡逑的稀疏对角矩阵存在的情况,现有算法都存在着一定的不足。因此,本论文对稀疏对逡逑角矩阵进一步进行研宄,基于CUDA邋(ComputeUnifiedDeviceArchitecture),通过提逡逑出一种自适应的并行稀疏对角矩阵矢量乘算法,完美解决了稀疏对角矩阵中存在散点、逡逑长断行或者对角线偏离主对角线较远等情况问题。逡逑另外,在均匀网格上离散偏微分方程组时,对于每个网格节点上具有高自由度的逡逑结构化网格问题产生的矩阵,其非零元素结构往往具有一定规律,呈现如图1.3的样逡逑式。图1.3中的稀疏矩阵被称为稀疏块对角矩阵。逡逑显然,DIA格式不适合这种稀疏块对角矩阵的存储。CSR和ELL虽然能有效存逡逑2逡逑
??逦??????'?邋■长断行逡逑图1.2稀疏对角矩阵实例逡逑为此,Yuan邋等[5]2010邋年提出了邋DDD-NAlVE邋和邋DDD-SPLIT邋算法。DDD-NAiVE逡逑算法依次存储对角线上元素,对于含有稠密对角线矩阵具有较好的效率,但无法解决逡逑对角线存在长断行情况。DDD-SPLIT算法利用对角线将稀疏矩阵分块,通过压缩相逡逑同元素节省存储空间。然而,这两种算法均未给出并行解决方案。Sun等W在2011年逡逑提出了邋CRSD邋(Compressed邋Row邋Segment邋with邋Diagonal邋Pattern)格式,相比邋DIA,含巨逡逑大大减少零元素的填充。在CRSD中,通过定义对角线模式表示对角线分布,将对角逡逑线分到不同组,进而将矩阵分成若干行段;如果行段中对角线上元素具有相同模式,逡逑则将此类行段看成一个存储和操作单元
【相似文献】
相关期刊论文 前10条
1 张友惠;;分块次对角矩阵的定义及性质[J];湖南科技学院学报;2008年04期
2 钱爱林,吴又胜;对称双边对角矩阵的特征值问题[J];河西学院学报;2005年05期
3 刁新军;黄廷祝;曾翎;冉瑞生;;五对角矩阵的分解及其逆元素的快速算法[J];电子科技大学学报;2005年06期
4 吴燕翔,王良恩,邱挺;二对角矩阵法及其在催化精馏塔模拟计算中的应用[J];福州大学学报(自然科学版);2000年01期
5 黄镜新;模糊错误二类5对角矩阵方程求解[J];广东工业大学学报;1998年S1期
6 周小庄,胡锡炎;实对称五对角矩阵及其特征反问题[J];湖南大学学报(自然科学版);1996年01期
7 吴长勤,张银云;灰对角矩阵的一些性质[J];安徽农业技术师范学院学报;1997年04期
8 周志华;吴汉金;李永元;侯怀德;;上机图及配色效应图内部转换的数学模型[J];中国纺织大学学报;1988年03期
9 钱岷江;;基于双线性变换从S域到Z域的对角矩阵算法[J];现代机械;1988年04期
10 王秀玉,姜兴武,李慧玲;对称双边对角矩阵的性质及广义逆[J];东北师大学报(自然科学版);2005年03期
相关会议论文 前4条
1 黄镜新;;二类4模糊错误对角矩阵方程求解[A];1998年中国智能自动化学术会议论文集(上册)[C];1998年
2 王健;陈丙珍;何小荣;;化工过程模拟与优化的新进展——并行计算方法[A];过程系统工程2001年会论文集[C];2001年
3 毛希安;;二维NOE谱幅度矩阵的数学特性[A];第七届全国波谱学学术会议论文摘要集[C];1992年
4 梁冬梅;马玉臣;;多体格林函数方法研究二元砷化物的光电特性[A];中国化学会第十二届全国量子化学会议论文摘要集[C];2014年
相关重要报纸文章 前1条
1 教育部考试中心命题一部、社会考试处;考研细看命题变化[N];中国教育报;2002年
相关博士学位论文 前1条
1 聂玺;阵列信号二维测向算法研究[D];电子科技大学;2015年
相关硕士学位论文 前10条
1 夏羿飞;面向GPU的并行稀疏对角矩阵矢量乘算法研究及应用[D];南京师范大学;2019年
2 李志勇;基于对角矩阵的温湿度模糊解耦控制系统的研究[D];石家庄铁道大学;2018年
3 蔺彦玲;几类特殊矩阵求其逆的快速算法研究[D];陕西科技大学;2017年
4 郑永梅;实对称五对角矩阵的逆特征值问题[D];南京航空航天大学;2009年
5 郭晶晶;图的无符号拉普拉斯特征值[D];浙江师范大学;2013年
6 刘婷;块五对角线性方程求解[D];华东师范大学;2009年
7 沈诺;关于某些三对角矩阵的研究[D];山东师范大学;2014年
8 焦江磊;基于异构系统的多对角矩阵并行计算研究[D];哈尔滨工程大学;2016年
9 白翠霞;线性脉冲微分系统的渐近解[D];天津大学;2009年
10 刁新军;五对角矩阵和广义等对角优势矩阵的数值分析[D];电子科技大学;2004年
本文编号:2746746
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2746746.html