当前位置:主页 > 科技论文 > 计算机论文 >

BWDSP译码器自动验证及编译向量化的研究与实现

发布时间:2017-06-26 13:07

  本文关键词:BWDSP译码器自动验证及编译向量化的研究与实现,,由笔耕文化传播整理发布。


【摘要】:BWDSP是一款高性能数字信号处理器,同时兼容16位和32位定点数据格式,采用超长指令字架构,具有强大的并行处理能力,能较好的满足高速实时信号处理的应用要求。BWDSP具有多个执行簇,每个执行簇上有多个运算部件,同时提供了多种类型的向量化指令,为SIMD编译优化提供了大量的机会和支持。本文的主要工作包括两点。其一,设计并实现了BWDSP指令译码器的自动化验证平台;其二,在Open64编译基础设施的基础上研究并实现了基于高层WHIRL表示的支持BWDSP程序SIMD优化的编译算法。 DSP译码器自动化验证平台是在BWDSP译码器的基础上,为了验证不断变动的指令集译码器的正确性,基于面向对象的理念设计的一套译码器验证工具。平台的设计首次使用了面向对象的思想。自动化译码器验证方案能够很好的支持重用和扩展,针对指令集的变动和扩展,能够在极短的时间内完成对应的测试版本。 本文在OPEN64编译基础设施的基础之上,提出并实现了基于高层WHIRL表示的SIMD向量化算法。算法主要在OPEN64的中间语言高层WHIRL上进行,以最内层循环为主要优化对象,通过一系列的分析和变换工作,发现并利用程序循环潜在的指令并行,将该类操作进行SIMD优化处理。此外,BWDSP指令集还包括一些特殊的向量化指令,针对这些指令,算法也增加了对应的SIMD替换过程,通过对特殊向量化机会的识别,找到并替换成特殊SIMD操作,从而在WHIRL树层次上完成特殊指令SIMD变换。特殊SIMD操作替换算法已经实现了BWDSP指令集中的所有特殊向量化指令的替换优化算法。最终的实验结果表明,基于高层WHIRL表示的SIMD优化算法在BWDSP上针对可合成单字和双字的循环程序能够分别取得平均6.30倍和4.15倍的加速比。这表明,基于树匹配的SIMD优化算法对循环程序的效率提高是非常可观的。
【关键词】:指令译码器 指令对象模型 单指令多数据流 树节点替换 特殊指令替
【学位授予单位】:中国科学技术大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP332
【目录】:
  • 摘要5-6
  • ABSTRACT6-7
  • 目录7-10
  • 第1章 绪论10-16
  • 1.1 研究背景10-14
  • 1.1.1 指令译码器10
  • 1.1.2 指令级并行10-11
  • 1.1.3 软硬件协同测试11-12
  • 1.1.4 SIMD编译优化12-13
  • 1.1.5 数字信号处理器BWDSP13-14
  • 1.2 主要工作14
  • 1.2.1 研究内容14
  • 1.2.2 研究意义14
  • 1.3 论文组织14-16
  • 第2章 指令系统及编译基础设施16-34
  • 2.1 BWDSP体系结构16-17
  • 2.2 BWDSP指令系统17-20
  • 2.2.1 基本运算指令17-18
  • 2.2.2 访存指令18-19
  • 2.2.3 簇间传输指令19
  • 2.2.4 双字指令19-20
  • 2.3 OPEN64编译基础设施20-30
  • 2.3.1 OPEN64编译基础设施20-21
  • 2.3.2 中间语言WHIRL概述21-23
  • 2.3.3 WHIRL节点和符号表23-27
  • 2.3.4 WHIRL程序简介27-30
  • 2.4 OPEN64机器无关优化30-33
  • 2.4.1 过程间分析优化30-32
  • 2.4.2 全局标量优化32-33
  • 2.4.3 循环嵌套优化33
  • 2.5 本章小结33-34
  • 第3章 BWDSP译码器自动验证平台34-50
  • 3.1 引言34
  • 3.2 译码器相关的功能模块34-38
  • 3.3 译码器功能模型38-45
  • 3.3.1 概述38-39
  • 3.3.2 指令对象创建模型39-41
  • 3.3.3 指令对象模型41-42
  • 3.3.4 译码比对验证42-45
  • 3.4 重用与扩展45
  • 3.5 自动化验证实验45-47
  • 3.6 本章小结47-50
  • 第4章 基于高层WHIRL表示的SIMD优化算法50-68
  • 4.1 引言50
  • 4.2 循环嵌套优化50-51
  • 4.3 基于高层WHIRL表示的SIMD优化算法51-64
  • 4.3.1 可向量化的目标指令51-53
  • 4.3.2 算法概述53-54
  • 4.3.3 SIMD预分析54-55
  • 4.3.4 循环SIMD化处理55-56
  • 4.3.5 特殊SIMD指令识别56-60
  • 4.3.6 SIMD预处理60-61
  • 4.3.7 SIMD指令替换61-63
  • 4.3.8 SIMD后续处理63-64
  • 4.4 实验与效率分析64-66
  • 4.5 本章小结66-68
  • 第5章 总结68-70
  • 5.1 论文总结68-69
  • 5.2 进一步工作69-70
  • 参考文献70-72
  • 附录1 插图索引72-74
  • 附录2 表格索引74-76
  • 致谢76-78
  • 在读期间发表的学术论文78-79
  • 攻读学位期间参加的科研项目79

【参考文献】

中国期刊全文数据库 前1条

1 郑启龙;汪胜;夏霏;;DSP编译器中一种基于子图的分簇算法[J];微电子学与计算机;2010年08期


  本文关键词:BWDSP译码器自动验证及编译向量化的研究与实现,由笔耕文化传播整理发布。



本文编号:486220

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/486220.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户8ef85***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com