GPU稀疏矩阵向量乘的性能模型构造
本文关键词:GPU稀疏矩阵向量乘的性能模型构造 出处:《计算机科学》2017年04期 论文类型:期刊论文
【摘要】:稀疏矩阵向量乘(Sparse matrix-vector multiplication,SPMV)是广泛应用于大规模线性求解系统和求解矩阵特征值等问题的基本运算,但在迭代处理过程中它也常常成为处理的瓶颈,影响算法的整体性能。对于不同形态的矩阵,选择不同的存储格式,对应的算法往往会产生较大的性能影响。通过实验分析,找到各种矩阵形态在不同存储结构下体现的性能变化特征,构建一个有效的性能度量模型,为评估稀疏矩阵运算开销、合理选择存储格式做出有效的指导。在14组CSR,COO,HYB格式和8组ELL格式的测试用例下,性能预测模型和测量之间的差异低于9%。
[Abstract]:Sparse matrix vector multiplies parse matrix-vector multiplication. SPMV is widely used in solving large-scale linear systems and solving matrix eigenvalues and other basic operations, but in the iterative process, it is often the bottleneck of processing. Affect the overall performance of the algorithm. For different forms of matrix, choose different storage format, the corresponding algorithm will often have a greater performance impact. Through experimental analysis. Find out the performance characteristics of various matrix shapes in different storage structures, and construct an effective performance measurement model to evaluate the sparse matrix computing overhead. The difference between the performance prediction model and the measurement is lower than that in the test cases of 14 groups of CSR / COOOHYB format and 8 groups of ELL format.
【作者单位】: 武汉大学计算机学院;湖北工程学院计算机与信息科学学院;
【基金】:国家自然科学基金面上项目(61572377),国家自然科学基金青年项目(61502154) 湖北省教育厅项目(2016179)资助
【分类号】:TP332
【正文快照】: 些不规则行有更多的非零元素;COO是最直观的存储格式,1 引言但性能比其他格式略差。不同的矩阵可能有它们自己最合适稀疏矩阵向量乘是一种广泛应用于大规模线性求解系统的单一的存储格式来实现最佳的性能。此外还存在一种可能和求解矩阵特征值等问题[1]的基本运算,在迭代方法
【相似文献】
相关期刊论文 前10条
1 纪效霞;陈柯;;有限元中稀疏矩阵的存储[J];枣庄学院学报;2008年05期
2 李长兴;;稀疏矩阵的转置[J];计算机光盘软件与应用;2013年05期
3 史树民,董相端;稀疏矩阵在统计文件组织中的应用[J];计算机应用与软件;1987年06期
4 张兴令,郭敏燕;一个高阶稀疏矩阵的压缩存放法[J];计算机应用与软件;1987年06期
5 李昱明,董万鹏,彭颖红;基于0-1属性矩阵的矩阵压缩存贮方法研究[J];计算机工程与应用;2003年02期
6 蒋川群;杜奕;;稀疏矩阵相乘的一个改进算法[J];计算机工程与应用;2009年19期
7 任建民,张义门;模拟半导体器件的一种稀疏矩阵及其算法[J];电子科学学刊;1989年01期
8 高凤荣,杜小勇,王珊;一种基于稀疏矩阵划分的个性化推荐算法[J];微电子学与计算机;2004年02期
9 褚一平;陈勤;吴铤;;大型稀疏矩阵线形相关列的求解算法和实现方法研究[J];石油工业计算机应用;2004年04期
10 居悌;电路的计算机辅助设计——八、稀疏矩阵技术[J];微电子学与计算机;1986年08期
相关会议论文 前3条
1 宋琦;陈璞;;稀疏求解—结构修改的一种新的可能性[A];北京力学会第20届学术年会论文集[C];2014年
2 徐道远;王宝庭;王向东;冯伯林;;求解大型稀疏矩阵的ICCG法[A];第八届全国结构工程学术会议论文集(第Ⅰ卷)[C];1999年
3 苑维然;陈璞;刘凯欣;;非对称线性方程组的快速外存解法[A];中国力学学会学术大会'2005论文摘要集(下)[C];2005年
相关硕士学位论文 前10条
1 刘健;基于稀疏矩阵分解的特征基因识别方法研究[D];曲阜师范大学;2015年
2 庄立;稀疏矩阵向量乘及自动调优[D];杭州电子科技大学;2011年
3 王冬;面向差异特征识别的稀疏矩阵分解方法的研究[D];曲阜师范大学;2016年
4 冯广祥;大型稀疏矩阵直接求解算法的研究及实现[D];东北大学;2010年
5 丁玲;低秩与稀疏矩阵恢复问题的若干研究[D];浙江大学;2012年
6 吴超凡;基于UB树的大型稀疏矩阵存储研究[D];云南大学;2013年
7 王亚南;基于FPGA的稀疏矩阵分解实现[D];西安电子科技大学;2009年
8 赵加强;基于OpenCL的稀疏矩阵向量乘优化[D];吉林大学;2012年
9 施浩;基于FPGA的稀疏矩阵向量乘的优化研究与实现[D];南京邮电大学;2011年
10 胡耀国;基于GPU的有限元方法研究[D];华中科技大学;2011年
,本文编号:1436919
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1436919.html