当前位置:主页 > 科技论文 > 计算机论文 >

基于多核平台SpMV并行技术研究

发布时间:2020-07-14 16:43
【摘要】: 目前各个领域都有大量的多核体系结构处理器投入使用,从手机芯片到超级计算机,多核体系结构都占据着越来越重要的地位。多核已经成为了当今处理器体系结构发展的主流和趋势。在高性能计算领域,多核处理器平台的潜力并未充分发掘出来。为了使得具有更高并行度需求的应用能充分利用多核处理器提供的强大计算能力,非常有必要对不同应用中的各类算法针对多核结构进行研究。稀疏矩阵向量乘(Sparse Matrix-Vector Multiplication, SpMV)作为多类科学计算过程不可缺少的一部分,其计算效率对科学计算程序的最终性能有着重要的影响。 本文以SpMV为例,研究数值算法在多核平台上的性能优化过程,主要的工作如下: 1、研究了现有的SpMV优化的方法,分析了各种方法的特点及适用范围,重点关注了数据存储结构和线程优化两方面; 2、研究了多核处理器的体系结构,分析体系结构中对并行计算性能的重要影响因素,尤其是存储结构对并行计算性能的影响; 3、设计了一种线程与处理器内核问的绑定方案,详细阐述了具体的方法及该方案的实际意义; 4、提出了一种线程划分方案:该方案可增强线程间的数据共享关系,同时结合线程绑定技术,可提高SpMV的二级缓存命中率,进而提高SpMV的计算效率; 以国际上公认的矩阵测试集为基准程序,同时利用PAPI工具访问硬件性能计数器,获取程序的二级缓存失效等性能数据,对本文提出的方案进行了实验验证;数值试验表明,合理的线程绑定可以提升程序执行的性能;而本文提出的线程划分方案,也提高了SpMV计算性能。
【学位授予单位】:国防科学技术大学
【学位级别】:硕士
【学位授予年份】:2009
【分类号】:TP332
【图文】:

核图,多核,处理器,多核结构


目目6核 /999核 核 核图1一 12009年11月Top500中各类处理器数量及比例多核处理器经历了十几年的发展中经历了自19%年的首个多核结构原型,到2001年IBM推出第一个商用多核处理器POWER4,再到2005年Intel和AMD多核处理器的大规模应用,最后成为了现在多核成为市场主流。在这个过程中,多核处理器的应用范围已覆盖了多媒体计算、嵌入式设备、个人计算机、商用服务器和高性能计算机等众多领域。由此我们可以很清楚地看到,无论是应用领域,还是科研领域,我们已经完全地走进了多核时代。第4页

示意图,存储格式,示意图,向量


二止一一二丁二二---一m+l门d:r.mPI图2一 1CSR存储格式示意图图中每一行中的非零元素用一种阴影表示。矩阵A中的所有非零元素按行依次排列压缩为一个稠密向量val,再由一个与val相对应的整数向量ind与之对应,ind中与val对应位置存放val中元素属于A的哪一列。另外,附加ptr向量,分别指出A的每一行元素在向量val中的起始位置。这样,由于在稀疏矩阵A中非零元素相对较少,所以相对于原始的矩阵A,用于存放矩阵的向量val

示意图,存储格式,示意图,矩形


二几几几几几二_______l呐OOCr图2一 2BCSR存储格式示意图图中每个3x2的矩形块对应同一个行、列坐标,即BCSR存储时的最小单元。图中黑点表示非零元素,val中存储的是每个小矩形块中元素的数值,col中对应存储了每个小矩形块的列坐标,row则存储了以矩形块为最小单位的每行中第一个矩形块对应col数组中的位置。可以看出,某些矩形块中包含部分零元素,这就是BCSR格式引入的新的开销,即为了使得某些相对较为分散的非零元素凑足一个矩形块,需要引入部分零元素。在决定作为最小单位的矩形块大小时

【共引文献】

相关期刊论文 前1条

1 白洪涛;欧阳丹彤;李熙铭;李亭;何丽莉;;基于GPU的稀疏矩阵向量乘优化[J];计算机科学;2010年08期

相关博士学位论文 前1条

1 白洪涛;基于GPU的高性能并行算法研究[D];吉林大学;2010年



本文编号:2755224

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2755224.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户5afa7***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com