当前位置:主页 > 科技论文 > 计算机论文 >

FitenBLAS:面向FT1000微处理器的高性能线性代数库

发布时间:2019-09-17 12:40
【摘要】:BLAS库是基本线性代数子程序库,是许多大型科学与工程计算的核心计算程序,FitenBLAS库是在多核多线FT1000微处理器上开发的基本线性代数库,其研制对FT1000微处理器在科学与工程计算中的应用具有重要意义.根据多级存储结构和寄存器的数目,设计了向量与向量、矩阵与向量和矩阵与矩阵运算的多级循环展开方法,采用指令调度、数据预取等通用优化技术,优化BLAS库串行程序.对于BLAS3子程序,设计了矩阵乘无冗余数据拷贝分块算法,采用指令重排、访存与计算的重叠、分块等技术优化矩阵乘子程序,基于矩阵乘子程序实现了其他BLAS3子程序.研制了汇编线性代数程库FitenBLAS,其核心子程序矩阵乘的双精度计算性能达到6.91Gflops,是峰值性能的86.4%.
【作者单位】: 国防科技大学并行与分布处理重点实验室;
【基金】:国家自然科学基金资助项目(60970033) 国家高技术研究发展计划(863计划)资助项目(2012AA01A301)~~
【分类号】:TP332

【共引文献】

相关期刊论文 前4条

1 刘仲;田希;陈磊;;支持原位计算的高效三角矩阵乘法向量化方法[J];国防科技大学学报;2014年06期

2 李焱;张云泉;;异构平台上性能自适应FFT框架[J];计算机研究与发展;2014年03期

3 邹燕燕;安虹;崔慧敏;周军蕊;;矩阵形状无关的并行编译优化[J];小型微型计算机系统;2014年07期

4 刘刚;张恒;毛睿;陆克中;;面向龙芯3B1500体系结构的DGEMM函数优化[J];小型微型计算机系统;2014年07期

相关博士学位论文 前2条

1 张志敏;化学计量学算法实现的软件开发基础研究[D];中南大学;2012年

2 贾海鹏;面向GPU计算平台的若干并行优化关键技术研究[D];中国海洋大学;2012年



本文编号:2536860

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2536860.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e36a8***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com