基于有向图可达性的SLP向量化识别方法
[Abstract]:SLP (superword level parallelism) is a method to implement SIMD (single instruction multiple data) vectorization, which is implemented by current mainstream vectorization compilers. However, when SLP vectorization is carried out in current algorithms, the analysis process of vectorization cycles in applications is too conservative, which leads to insufficient ability to identify SLP vectorization. In order to improve this capability, a SLP vectorization method based on directed graph reachability is proposed in this paper. Firstly, a directed graph containing information of array and statement dependency is constructed based on array dependency graph, so that all array nodes in the same statement are within a strongly connected component, and the dependency edges between strongly connected components are pruned. Secondly, the reachability between nodes with different strongly connected components is analyzed, and all the dependent information needed to identify SLP vectorization is obtained according to the reachability of nodes, so as to determine whether the loop in the statement can be vectorized by SLP. After the implementation of this method in the Open64-5.0 compiler, the SLP vectorization effect is greatly improved. The experimental results of gcc-vect test set show that the optimized Open64-5.0 compiler has better ability to identify SLP vectorization cycles than GCC4.9, and Intel ICC14.0, and the performance of generated vectorized codes is better than that of current optimal algorithms.
【作者单位】: 解放军信息工程大学数学工程与先进计算国家重点实验室;
【基金】:“核高基”国家科技重大专项(批准号:2009ZX01036-001-001-2) 数学工程与先进计算国家重点实验室开放课题(批准号:2013A11)资助项目
【分类号】:TP314
【相似文献】
相关期刊论文 前10条
1 吴明霞;陈火旺;;串行运算向量化初探[J];计算机工程与科学;1980年02期
2 吴明霞,陈火旺;串行运算向量化[J];计算机学报;1981年03期
3 范植华 ,吴健安 ,郭强 ,魏奎超;向量化中的识别指导性指令[J];计算机工程与科学;1985年03期
4 范植华;向量化概论[J];电子学报;1986年03期
5 陈晓桦,杨桃栏;向量化中的分段处理[J];计算机学报;1989年08期
6 李勇;何伟;李秉辉;;地图向量化的尝试[J];农村电工;2006年04期
7 吴健安;;串行运算向量化综述[J];计算机工程与科学;1980年03期
8 陈晓桦;分段处理技术在向量化中的应用[J];计算机工程与科学;1986年03期
9 范植华;向量化性态的比较判别法[J];电子学报;1991年05期
10 黄磊;姚远;侯永生;杨明;;自动向量化中基于数据依赖分析的循环分布算法[J];计算机科学;2011年09期
相关会议论文 前2条
1 ;用非向量化聚类和预测方法改善“开始-结束”机制的运行效率(英文)[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
2 黄君辉;刘仲;陈跃跃;;一种基于YHFT-Matrix的FFT向量化实现[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年
相关硕士学位论文 前7条
1 周羽丰;Matrix2可扩展向量化编译方法的设计与实现[D];国防科学技术大学;2014年
2 高翔;集成众核平台科学计算应用性能测评和优化研究[D];国防科学技术大学;2014年
3 夏睿杰;基于FT-Matrix2的自动向量化关键技术研究与实现[D];国防科学技术大学;2015年
4 徐颖;编译指导的自动向量化关键技术研究[D];国防科学技术大学;2014年
5 张媛媛;自动向量化中的收益评估技术研究[D];解放军信息工程大学;2011年
6 索维毅;面向DSP的自动向量化及优化技术研究[D];解放军信息工程大学;2013年
7 徐华叶;多簇VLIW DSP向量化相关编译技术研究[D];中国科学技术大学;2014年
,本文编号:2434129
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2434129.html