基于龙芯3A2000处理器的高性能Goto BLAS库的实现
本文选题:Goto + BLAS ; 参考:《高技术通讯》2016年Z2期
【摘要】:用Linpack测试集测试了计算机系统浮点性能,测试用函数运算库为Goto BLAS库。该库对Linpach的测试结果有很大影响。为了提高Goto BLAS性能,观察了Goto BLAS库在龙芯3A2000处理器平台的性能表现,分析了测试软件的执行流程、数据的处理方法,根据处理器的结构特点,合理配置矩阵分块参数,优化核心循环的实现方案,同时采用软硬件数据预取技术及优化的内核TLB配置策略。在这些优化方法的共同作用下,仿真平台上核心函数的浮点部件效率超过90%。优化方案在本实验中取得了显著的效果。
[Abstract]:The floating-point performance of computer system is tested with Linpack test set, and the function operation library is Goto BLAS library. This library has great influence on the test results of Linpach. In order to improve the performance of Goto BLAS, the performance of Goto BLAS library in Longson 3A2000 processor platform is observed, and the execution flow of test software and the method of data processing are analyzed. According to the structural characteristics of the processor, the block parameters of matrix are reasonably configured. At the same time, the hardware and software data prefetching technology and the optimized kernel TLB configuration strategy are used to optimize the implementation of the core cycle. Under the joint action of these optimization methods, the floating-point component efficiency of the core function on the simulation platform is more than 90%. The optimized scheme has achieved remarkable results in this experiment.
【作者单位】: 中国科学院计算技术研究所计算机体系结构国家重点实验室;中国科学院大学;龙芯中科技术有限公司;
【基金】:“核高基”科技重大专项课题(2014ZX01020201) 863计划(2012AA012202,2013AA014301)资助项目
【分类号】:TP332;TP306
【相似文献】
相关期刊论文 前10条
1 ;新一代高端服务器的标准──康柏8路处理器系统结构[J];上海微型计算机;2000年36期
2 ;调试嵌入式处理器的几种常用方法[J];电子产品世界;2003年08期
3 ;软核嵌入式处理器挑战性价比[J];今日电子;2004年06期
4 仲海梅;纪斌;;安全处理器的研究[J];计算机与信息技术;2007年05期
5 Jorge Carrillo;Raj Nagarajan;Oliver Oppitz;;应对高级嵌入式处理器系统调试挑战[J];电子设计技术;2008年11期
6 ;飞思卡尔为成本敏感的网络和工业应用推出新处理器[J];单片机与嵌入式系统应用;2010年12期
7 ;飞思卡尔为成本敏感的网络和工业应用推出新处理器[J];电子产品世界;2010年12期
8 ;飞思卡尔为成本敏感的网络和工业应用推出新处理器[J];世界电子元器件;2010年12期
9 ;飞思卡尔为成本敏感的网络和工业应用推出新处理器[J];半导体技术;2011年01期
10 王晨旭;张凯峰;张祥建;喻明艳;;嵌入式处理器中分支目标缓冲器的研究与设计[J];微电子学与计算机;2012年01期
相关会议论文 前1条
1 梁祺恺;;Si(Li)X射线谱仪用的315型脉冲处理器[A];第7届全国核电子学与核探测技术学术年会论文集(一)[C];1994年
相关重要报纸文章 前10条
1 ;采用通用技术 SGI销售高端Linux系统[N];计算机世界;2003年
2 ;预计下半年正式推向市场[N];人民邮电;2009年
3 本报记者 姜波;高端大事件[N];网络世界;2004年
4 庄庄;64位处理器前瞻[N];中国计算机报;2002年
5 广西 姑苏飘雪;走入双(多)内核处理器的世界[N];电脑报;2004年
6 吴挺;多核不问真假[N];计算机世界;2007年
7 Ray;一个顶俩 Intel Hyper-Threading技术[N];中国计算机报;2002年
8 新城;突破频率的桎梏[N];计算机世界;2001年
9 袁钦玲;AMD紧抓SQL Server 2005企业市场机会[N];中国计算机报;2005年
10 孙定;明年,英特尔的黄金时代或将终结[N];计算机世界;2011年
相关博士学位论文 前9条
1 王延升;粗粒度动态可重构处理器中的高能效关键配置技术研究[D];清华大学;2014年
2 张晓旭;应用驱动的多处理器片上系统能耗优化技术研究[D];浙江大学;2015年
3 洪春涛;众核处理器编程模式关键技术研究[D];清华大学;2011年
4 陈小文;同构众核处理器的片上存储管理与同步机制研究[D];国防科学技术大学;2011年
5 段然;嵌入式可重构DSP体系结构研究[D];西北工业大学;2005年
6 韩泽耀;高速高性能FFT处理器的VLSI实现研究[D];浙江大学;2002年
7 赵学秘;可编程密码处理器关键技术研究与实现[D];国防科学技术大学;2006年
8 李文;存储控制系统性能优化技术研究[D];中国科学院研究生院(计算技术研究所);2005年
9 郑伟;多媒体应用的高性能数字信号处理器功能部件结构设计研究[D];浙江大学;2003年
相关硕士学位论文 前10条
1 何惊昱;16位RISC处理器的设计和FPGA实现[D];兰州大学;2015年
2 王桂花;非相似平台管理计算机的余度管理技术研究[D];哈尔滨工业大学;2015年
3 杨帆;安全处理器研究[D];华北电力大学;2015年
4 张学敏;基于可扩展片上系统的处理器设计[D];电子科技大学;2014年
5 王康;应用于MIMO-OFDM系统的高性能FFT/IFFT处理器的设计及实现[D];电子科技大学;2014年
6 任玉涛;钢水红外辐射测温信号处理器的研究与实现[D];东北大学;2013年
7 陈小均;基于FPGA+DSP的某监控雷达信号处理器设计与实现[D];南京理工大学;2014年
8 段金松;荧光测铀系统的研究与应用[D];东华理工大学;2014年
9 韩君妹;SDR-4902软件无线电平台异构处理器互联架构设计与实现[D];国防科学技术大学;2013年
10 韩冬;钢水比色红外测温信号处理器的研究与实现[D];东北大学;2014年
,本文编号:1856963
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1856963.html