基于FT-Matrix2的自动向量化关键技术研究与实现
本文关键词:基于FT-Matrix2的自动向量化关键技术研究与实现
【摘要】:FT-Matrix2 DSP是国防科技大学微电子所自主研发的一款面向图像处理、视频和无线通信的高性能DSP。其采用向量和多发射超长指令字体系结构。其中,SIMD指令在FT-Matrix2指令集中的数量占比达到了近50%,而这些指令是芯片整体性能得到提升的关键。因此,FT-Matrix2编译器中SIMD向量化能力直接影响着芯片的运行效率。本文基于GCC平台研究并实现了FT-Matrix2编译器的自动向量化技术。本文根据FT-Matrix2体系结构特征,通过添加FT-Matrix2向量后端支持以及在自动向量化过程中增加DMA自动传输实现向量访存等技术,使得FT-Matrix2编译器能够尽量挖掘用户C程序的自动向量化部分,从而提高芯片的运行效率。本文的主要工作包括以下几个方面:(1)对GCC的编译结构、自动向量化框架进行了深入的分析。首先熟悉了GCC的结构框架,然后定位了自动向量化优化在GCC内部的位置,最后分析了自动向量化的的结构框架。通过对上述问题的深入分析,确定了基于GCC平台实现FT-Matrix2的向量化方法和步骤。(2)基于FT-Matrix2体系结构和指令集,在GCC中实现了SIMD指令自动向量化映射。其主要工作包括:添加向量寄存器描述,向量数据机器模式,向量指令描述,汇编输出等。(3)基于FT-Matrix2的自动向量化访存实现。基于FT-Matrix2体系结构向量访存的特点,在GCC中实现了基于DMA的自动数据传输功能,使得编译器能够根据向量程序要求自动生成向量数据搬移代码,实现了FT-Matrix2自动向量化的向量访存。(4)基于本文的研究工作,对DSP常用算法FFT进行了自动向量化实现,测试结果表明:基于FT-Matrix2 Compiler的自动向量化较-O2级优化非向量化性能有明显的提高,而较intrinsic方式向量化性能较低。
【关键词】:SIMD 自动向量化 向量访存 DMA
【学位授予单位】:国防科学技术大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP332
【目录】:
- 摘要9-10
- ABSTRACT10-11
- 第一章 绪论11-19
- 1.1 研究背景11-12
- 1.2 自动向量化简介及研究现状12-15
- 1.3 开发平台选择15-16
- 1.4 论文的主要工作16-17
- 1.5 论文结构和组织17-19
- 第二章 GCC自动向量化框架分析19-34
- 2.1 GCC编译结构分析19-23
- 2.2 自动向量化的的框架分析23-33
- 2.2.1 循环的向量化可行性分析25-30
- 2.2.2 循环的向量化转换30-33
- 2.3 本章小结33-34
- 第三章 基于FT-Matrix2的自动向量化实现34-46
- 3.1 FT-Matrix2体系结构34-37
- 3.1.1 FT-Matrix2内核结构34-35
- 3.1.2 FT-Matrix2指令集35-37
- 3.2 FT-Matrix2向量后端移植37-41
- 3.2.1 向量寄存器描述37-38
- 3.2.2 向量数据机器模式38-41
- 3.3 FT-Matrix2向量指令实现41-45
- 3.3.1 指令映射分析41-42
- 3.3.2 指令映射实现42-45
- 3.4 本章小结45-46
- 第四章 基于FT-Matrix2的向量访存实现46-57
- 4.1 FT-Matrix2向量访存介绍与分析46-47
- 4.2 自动向量化的向量访存实现过程47-48
- 4.3 基于DMA自动传输的向量访存实现48-54
- 4.4 基于SVR传输的向量访存实现54-56
- 4.5 本章小结56-57
- 第五章 基于FT-Matrix2的FFT算法的自动向量化实现57-68
- 5.1 FFT算法介绍及分析57-61
- 5.1.1 FFT算法介绍57-58
- 5.1.2 FFT算法的自动向量化实现分析58-61
- 5.2 实验结果及性能分析61-67
- 5.3 本章小结67-68
- 第六章 总结与展望68-71
- 6.1 全文总结68-69
- 6.2 展望69-71
- 致谢71-73
- 参考文献73-77
- 作者在学期间取得的学术成果77
【相似文献】
中国期刊全文数据库 前10条
1 吴明霞;陈火旺;;串行运算向量化初探[J];计算机工程与科学;1980年02期
2 吴明霞,陈火旺;串行运算向量化[J];计算机学报;1981年03期
3 范植华 ,吴健安 ,郭强 ,魏奎超;向量化中的识别指导性指令[J];计算机工程与科学;1985年03期
4 范植华;向量化概论[J];电子学报;1986年03期
5 陈晓桦,杨桃栏;向量化中的分段处理[J];计算机学报;1989年08期
6 李勇;何伟;李秉辉;;地图向量化的尝试[J];农村电工;2006年04期
7 吴健安;;串行运算向量化综述[J];计算机工程与科学;1980年03期
8 陈晓桦;分段处理技术在向量化中的应用[J];计算机工程与科学;1986年03期
9 范植华;向量化性态的比较判别法[J];电子学报;1991年05期
10 黄磊;姚远;侯永生;杨明;;自动向量化中基于数据依赖分析的循环分布算法[J];计算机科学;2011年09期
中国重要会议论文全文数据库 前2条
1 ;用非向量化聚类和预测方法改善“开始-结束”机制的运行效率(英文)[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
2 黄君辉;刘仲;陈跃跃;;一种基于YHFT-Matrix的FFT向量化实现[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年
中国硕士学位论文全文数据库 前7条
1 周羽丰;Matrix2可扩展向量化编译方法的设计与实现[D];国防科学技术大学;2014年
2 高翔;集成众核平台科学计算应用性能测评和优化研究[D];国防科学技术大学;2014年
3 夏睿杰;基于FT-Matrix2的自动向量化关键技术研究与实现[D];国防科学技术大学;2015年
4 徐颖;编译指导的自动向量化关键技术研究[D];国防科学技术大学;2014年
5 张媛媛;自动向量化中的收益评估技术研究[D];解放军信息工程大学;2011年
6 索维毅;面向DSP的自动向量化及优化技术研究[D];解放军信息工程大学;2013年
7 徐华叶;多簇VLIW DSP向量化相关编译技术研究[D];中国科学技术大学;2014年
,本文编号:920387
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/920387.html