当前位置:主页 > 科技论文 > 计算机论文 >

LAPACK线性方程求解函数在龙芯3A上的并行化

发布时间:2018-07-12 15:43

  本文选题:LAPACK + BLAS ; 参考:《小型微型计算机系统》2014年05期


【摘要】:针对龙芯3A体系结构,该文通过变量代换或消除、简化依赖关系、增加热点数据副本、并行流水等方法对BLAS函数和LAPACK函数做并行化,基于原LAPACK库的结构层次实现了线性方程求解函数的并行化版本,用户只需设定核数重新编译出LAPACK的多核库便可使用.通过LAPACK自带的性能测试程序进行测试,实验结果表明,在四核模式下,大多数函数加速比达到2以上,部分函数加速比超过了3,所有线性方程求解类函数加速比的算术平均值达到2.04.
[Abstract]:In this paper, by means of variable substitution or elimination, dependency simplification, hot data replica, parallel pipelining and so on, the BLAS function and LAPACK function are parallelized. Based on the structure hierarchy of the original LAPACK library, the parallel version of the linear equation solving function is implemented. The user only need to set the kernel number to compile the LAPACK multi-core library. The test results show that, in the four-core mode, the speedup ratio of most functions is more than 2. The speedup ratio of some functions exceeds 3, and the arithmetic average of speedup of all linear equations is 2.04.
【作者单位】: 中国科学技术大学计算机科学技术学院;安徽省计算与通信软件重点实验室;中国科学技术大学中科院沈阳计算所网络与通信联合实验室;
【基金】:国家“核高基”重大专项项目(2009ZX01028-002-003-005)资助
【分类号】:TP311.11;TP332

【参考文献】

相关期刊论文 前4条

1 李毅;何颂颂;李恺;;多核龙芯3A上二级BLAS库的优化[J];计算机系统应用;2011年01期

2 顾丽红;吴少刚;;访存密集型应用在SMP机群系统中的性能分析[J];小型微型计算机系统;2006年07期

3 何颂颂;顾乃杰;朱海涛;刘燕君;;面向龙芯3A体系结构的BLAS库优化[J];小型微型计算机系统;2012年03期

4 刘畅;;求解三对角线性方程组两类并行算法的特点[J];中国教师;2009年S1期

【共引文献】

相关期刊论文 前3条

1 谢林川;;计算机性能优化技术中存在的问题[J];硅谷;2012年05期

2 毛晓炜;陶先平;何万青;;Intel Bensley平台下前端总线竞争对访存密集型程序的性能影响分析[J];南京大学学报(自然科学);2010年02期

3 何颂颂;顾乃杰;任开新;;一种面向数据密集型应用的并行程序执行模型[J];小型微型计算机系统;2013年07期

相关博士学位论文 前2条

1 龙柏;并行计算平台上的数据索引技术研究[D];中国科学技术大学;2011年

2 廖银;动态二进制翻译建模及其并行化研究[D];中国科学技术大学;2013年

相关硕士学位论文 前2条

1 冯X;嵌入式环境下三线性分解算法优化技术研究[D];湖南大学;2012年

2 钟逸;龙芯3A环境下的EJTAG调试技术[D];华中科技大学;2013年

【二级参考文献】

相关期刊论文 前4条

1 骆志刚,李晓梅,王正华;三对角线性方程组的一种有效分布式并行算法[J];计算机研究与发展;2000年07期

2 吴少刚,章隆兵,蔡飞,顾丽红,唐志敏;机群Open MP系统的设计与实现[J];计算机学报;2004年07期

3 苏波;李凯;徐志广;何颂颂;;龙芯2F上的访存优化[J];计算机系统应用;2010年01期

4 顾乃杰;李凯;陈国良;吴超;;基于龙芯2F体系结构的BLAS库优化[J];中国科学技术大学学报;2008年07期

【相似文献】

相关期刊论文 前10条

1 ;一切为了数字生活 航嘉多核DH6电源[J];电脑爱好者;2006年14期

2 李静;;使用多核电脑是浪费吗[J];IT时代周刊;2008年Z3期

3 李晓明;王韬;刘东;杜江凌;;走进多核时代[J];计算机科学与探索;2008年06期

4 伊君翰;;基于多核处理器的并行编程模型[J];计算机工程;2009年08期

5 肖朝晖;;计算机体系结构的发展及技术问题探讨[J];信息化纵横;2009年12期

6 黄安文;高军;张民选;;多核处理器片上存储系统研究[J];计算机工程;2010年04期

7 刘俊;刘志祥;;应用Amdahl定律对多核处理器性能的分析[J];信息技术;2010年06期

8 任平;;从UTM驾驭多核看信息安全产品的革新[J];信息安全与技术;2010年07期

9 刘热;;OpenMP多核技术研究及其在遗传算法中的应用[J];沈阳大学学报;2010年05期

10 周本海;乔建忠;林树宽;;基于多核处理器的动态共享缓存分配算法[J];东北大学学报(自然科学版);2011年01期

相关会议论文 前10条

1 刘涛;季振洲;王庆;朱素霞;;嵌入式多核平台大容量高速存储与增强可靠性研究[A];2010年第16届全国信息存储技术大会(IST2010)论文集[C];2010年

2 李鑫;窦勇;邓林;张劲;;多核平台下事务处理类应用性能分析及评价[A];2010年第16届全国信息存储技术大会(IST2010)论文集[C];2010年

3 何军;王飙;;通用多核处理器发展现状和趋势研究[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年

4 刘奇;郝守青;沈海华;章隆兵;;一种基于RAM的降低异构多核切换开销的方法[A];2010年第16届全国信息存储技术大会(IST2010)论文集[C];2010年

5 陈远知;;多核处理器的里程碑——TILE64[A];全国第三届信号和智能信息处理与应用学术交流会专刊[C];2009年

6 彭林;张小强;刘德峰;谢伦国;田祖伟;;一种挖掘多核处理器存储级并行的算法[A];第15届全国信息存储技术学术会议论文集[C];2008年

7 刘杰;马彦;叶维;高剑刚;;多核处理器存储体系分析[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年

8 陈远知;杨帆;;Tilera多核处理器网络应用研究[A];全国第五届信号和智能信息处理与应用学术会议专刊(第一册)[C];2011年

9 单书畅;胡瑜;李晓维;;多核处理器的核级冗余容错技术[A];第六届中国测试学术会议论文集[C];2010年

10 万志涛;;基于多核处理器的面向时延敏感服务的云基础架构[A];中国通信学会信息通信网络技术委员会2011年年会论文集(上册)[C];2011年

相关重要报纸文章 前10条

1 张云泉;并行计算:迎接多核时代的挑战[N];计算机世界;2006年

2 清华大学计算机系 教授 汪东升;多核架构让硬件变“软”[N];计算机世界;2007年

3 本报记者 李敬;多核催熟UTM[N];计算机世界;2008年

4 专题策划、撰稿:刘雨 编译:天虹;多核带来新格局[N];中国计算机报;2005年

5 清华大学计算机系 教授 郑纬民;“多核”成为关键词[N];计算机世界;2007年

6 《计算机世界》评测实验室 吴挺;图形工作站的多核棋局[N];计算机世界;2007年

7 刘学习;挺进多核[N];计算机世界;2006年

8 刘洪宇;x86多核技术解析[N];中国计算机报;2008年

9 评测实验室 吴挺;主板秋点兵[N];计算机世界;2004年

10 郭长佑;多核处理器:从封装到芯片[N];电子资讯时报;2006年

相关博士学位论文 前10条

1 侯宁;嵌入式多核处理器设计与实现关键技术研究[D];合肥工业大学;2012年

2 翟文正;基于模型的异构多核嵌入式系统开发研究[D];上海大学;2013年

3 王耀彬;多核平台上支持推测并行化的事务存储体系结构性能优化[D];中国科学技术大学;2010年

4 邓林;单芯片多核处理器存储优化技术研究[D];国防科学技术大学;2011年

5 郭御风;面向多核微处理器芯片的高效能I/O体系结构及其实现技术[D];国防科学技术大学;2010年

6 白明泽;多核集群上的混合并行分子动力学计算研究[D];电子科技大学;2012年

7 杜建军;共享高速缓存多核处理器的关键技术研究[D];重庆大学;2011年

8 聂鹏程;多核处理器上的操作系统调度[D];西安电子科技大学;2013年

9 陈芳园;基于多核处理器平台的实时系统WCET分析研究[D];国防科学技术大学;2011年

10 吕正;多核处理器存储系统的验证方法研究[D];西北大学;2013年

相关硕士学位论文 前10条

1 王雪梅;嵌入式多核处理器的仿真器设计[D];国防科学技术大学;2010年

2 程丹;NIOS Ⅱ多核通信及在神经网络硬件实现中的应用研究[D];东北师范大学;2010年

3 奚海波;并行编程技术在多核处理器上的研究与应用[D];东北师范大学;2010年

4 罗s,

本文编号:2117645


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2117645.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e1af5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com