当前位置:主页 > 科技论文 > 计算机论文 >

基于FT-Matrix2的自动向量化关键技术研究与实现

发布时间:2017-09-26 00:15

  本文关键词:基于FT-Matrix2的自动向量化关键技术研究与实现


  更多相关文章: SIMD 自动向量化 向量访存 DMA


【摘要】:FT-Matrix2 DSP是国防科技大学微电子所自主研发的一款面向图像处理、视频和无线通信的高性能DSP。其采用向量和多发射超长指令字体系结构。其中,SIMD指令在FT-Matrix2指令集中的数量占比达到了近50%,而这些指令是芯片整体性能得到提升的关键。因此,FT-Matrix2编译器中SIMD向量化能力直接影响着芯片的运行效率。本文基于GCC平台研究并实现了FT-Matrix2编译器的自动向量化技术。本文根据FT-Matrix2体系结构特征,通过添加FT-Matrix2向量后端支持以及在自动向量化过程中增加DMA自动传输实现向量访存等技术,使得FT-Matrix2编译器能够尽量挖掘用户C程序的自动向量化部分,从而提高芯片的运行效率。本文的主要工作包括以下几个方面:(1)对GCC的编译结构、自动向量化框架进行了深入的分析。首先熟悉了GCC的结构框架,然后定位了自动向量化优化在GCC内部的位置,最后分析了自动向量化的的结构框架。通过对上述问题的深入分析,确定了基于GCC平台实现FT-Matrix2的向量化方法和步骤。(2)基于FT-Matrix2体系结构和指令集,在GCC中实现了SIMD指令自动向量化映射。其主要工作包括:添加向量寄存器描述,向量数据机器模式,向量指令描述,汇编输出等。(3)基于FT-Matrix2的自动向量化访存实现。基于FT-Matrix2体系结构向量访存的特点,在GCC中实现了基于DMA的自动数据传输功能,使得编译器能够根据向量程序要求自动生成向量数据搬移代码,实现了FT-Matrix2自动向量化的向量访存。(4)基于本文的研究工作,对DSP常用算法FFT进行了自动向量化实现,测试结果表明:基于FT-Matrix2 Compiler的自动向量化较-O2级优化非向量化性能有明显的提高,而较intrinsic方式向量化性能较低。
【关键词】:SIMD 自动向量化 向量访存 DMA
【学位授予单位】:国防科学技术大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP332
【目录】:
  • 摘要9-10
  • ABSTRACT10-11
  • 第一章 绪论11-19
  • 1.1 研究背景11-12
  • 1.2 自动向量化简介及研究现状12-15
  • 1.3 开发平台选择15-16
  • 1.4 论文的主要工作16-17
  • 1.5 论文结构和组织17-19
  • 第二章 GCC自动向量化框架分析19-34
  • 2.1 GCC编译结构分析19-23
  • 2.2 自动向量化的的框架分析23-33
  • 2.2.1 循环的向量化可行性分析25-30
  • 2.2.2 循环的向量化转换30-33
  • 2.3 本章小结33-34
  • 第三章 基于FT-Matrix2的自动向量化实现34-46
  • 3.1 FT-Matrix2体系结构34-37
  • 3.1.1 FT-Matrix2内核结构34-35
  • 3.1.2 FT-Matrix2指令集35-37
  • 3.2 FT-Matrix2向量后端移植37-41
  • 3.2.1 向量寄存器描述37-38
  • 3.2.2 向量数据机器模式38-41
  • 3.3 FT-Matrix2向量指令实现41-45
  • 3.3.1 指令映射分析41-42
  • 3.3.2 指令映射实现42-45
  • 3.4 本章小结45-46
  • 第四章 基于FT-Matrix2的向量访存实现46-57
  • 4.1 FT-Matrix2向量访存介绍与分析46-47
  • 4.2 自动向量化的向量访存实现过程47-48
  • 4.3 基于DMA自动传输的向量访存实现48-54
  • 4.4 基于SVR传输的向量访存实现54-56
  • 4.5 本章小结56-57
  • 第五章 基于FT-Matrix2的FFT算法的自动向量化实现57-68
  • 5.1 FFT算法介绍及分析57-61
  • 5.1.1 FFT算法介绍57-58
  • 5.1.2 FFT算法的自动向量化实现分析58-61
  • 5.2 实验结果及性能分析61-67
  • 5.3 本章小结67-68
  • 第六章 总结与展望68-71
  • 6.1 全文总结68-69
  • 6.2 展望69-71
  • 致谢71-73
  • 参考文献73-77
  • 作者在学期间取得的学术成果77

【相似文献】

中国期刊全文数据库 前10条

1 吴明霞;陈火旺;;串行运算向量化初探[J];计算机工程与科学;1980年02期

2 吴明霞,陈火旺;串行运算向量化[J];计算机学报;1981年03期

3 范植华 ,吴健安 ,郭强 ,魏奎超;向量化中的识别指导性指令[J];计算机工程与科学;1985年03期

4 范植华;向量化概论[J];电子学报;1986年03期

5 陈晓桦,杨桃栏;向量化中的分段处理[J];计算机学报;1989年08期

6 李勇;何伟;李秉辉;;地图向量化的尝试[J];农村电工;2006年04期

7 吴健安;;串行运算向量化综述[J];计算机工程与科学;1980年03期

8 陈晓桦;分段处理技术在向量化中的应用[J];计算机工程与科学;1986年03期

9 范植华;向量化性态的比较判别法[J];电子学报;1991年05期

10 黄磊;姚远;侯永生;杨明;;自动向量化中基于数据依赖分析的循环分布算法[J];计算机科学;2011年09期

中国重要会议论文全文数据库 前2条

1 ;用非向量化聚类和预测方法改善“开始-结束”机制的运行效率(英文)[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年

2 黄君辉;刘仲;陈跃跃;;一种基于YHFT-Matrix的FFT向量化实现[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年

中国硕士学位论文全文数据库 前7条

1 周羽丰;Matrix2可扩展向量化编译方法的设计与实现[D];国防科学技术大学;2014年

2 高翔;集成众核平台科学计算应用性能测评和优化研究[D];国防科学技术大学;2014年

3 夏睿杰;基于FT-Matrix2的自动向量化关键技术研究与实现[D];国防科学技术大学;2015年

4 徐颖;编译指导的自动向量化关键技术研究[D];国防科学技术大学;2014年

5 张媛媛;自动向量化中的收益评估技术研究[D];解放军信息工程大学;2011年

6 索维毅;面向DSP的自动向量化及优化技术研究[D];解放军信息工程大学;2013年

7 徐华叶;多簇VLIW DSP向量化相关编译技术研究[D];中国科学技术大学;2014年



本文编号:920387

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/920387.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0b98a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com