基于X流处理器的循环实现及优化
发布时间:2020-09-18 10:30
随着图像处理、流体动力学、多媒体等的广泛应用,流处理器因其强大的数据并行开发能力而日渐占领微处理器设计的舞台。X流处理器的设计采用单指令多数据(SIMD)思想,多个同构运算单元对输入流数据循环处理。因而有效的循环实现机制及优化技术显得尤为重要,倍受中外学者关注。 由于循环方式的多样性,X流处理器不能采用传统的“单独一条指令实现一种循环方式”思想,否则会造成硬件设计的很大浪费。因此,本文采用将分支条件判断与循环跳转分离、分别为这两部分设置指令、将两部分指令自由组合的设计思想,通过完善循环指令集设计,覆盖所有的循环方式,以满足X流处理器循环结束方式的特殊性。 另外,X流处理器中的微代码存储空间十分有限,对此本文提出了一种适合X流处理器的软件流水实现机制,通过显性隐藏填充排空代码来减轻存储空间的压力,并完成了其硬件设计。 本文还研究了将循环(尤其是多重循环)级并行转化为指令级并行的两种常用技术:循环展开与软件流水。并在X流处理器目前尚只支持人工选定多重循环展开因子的情况下,提出了一种适合X流处理器的自动选择最短执行时间循环展开因子算法,并用C语言加以实现,实验数据表明该算法能取得很好的优化效果。 最后本文在X流处理器的通用测试平台上对其逐一进行了测试验证,证明了其正确性与有效性。这些循环实现与优化机制已应用于X处理器,并取得了很好的效果。 本文完成了X流处理器关于循环实现及优化技术的硬件设计,并为编译器对循环的进一步优化奠定了基础。
【学位单位】:国防科学技术大学
【学位级别】:硕士
【学位年份】:2006
【中图分类】:TP338.6
【部分图文】:
为了最大程度提高计算性能,其与传统 Von Neumann 结构相比有很大的区别它不但采用了不同的数据组织形式、分离了数据和指令,而且对数据访问、组指令和运算操作指令的执行模块也进行了耦解。2.1 流处理系统(SPS)模型在计算机科学领域内,流处理(stream processing)是主要应用于异构系统(isparate system)的研究技术[7]。如数据流系统(dataflow system)[8][9][10][11反馈系统(rezctive system)[12][13]、并发系统(synchronous concurrent system[14]、信号处理系统(signal processing system)[15]以及部分实时处理系统(re_time system)等都是流处理技术研究的实例。从概念上讲,这些系统都是基于流处理系统(stream processing system)研究的基础上的。从系统组成角度来看,流处理系统(SPS)包含三个组成部分:源(source向系统引入数据;滤(filter),执行一系列原子操作;漏(sink),从系统导出数结果。这三者并行工作,而相互之间则通过渠道(channel)来连接和通信,S的名字也正是由此得来。一个例子如图 2.1 所示:
X流处理器的整体框架图
图 2.3 微控制器 UC 结构框图块微代码存储器 MicroCode Store 模块用来存储核心执行的 VLIW执行的时候,MicroCode Store 模块根据 PC 把这些指令按序发icroCode Store 模块的结构如图 2.4 所示,它由微码存储模块、令排序模块组成。
本文编号:2821530
【学位单位】:国防科学技术大学
【学位级别】:硕士
【学位年份】:2006
【中图分类】:TP338.6
【部分图文】:
为了最大程度提高计算性能,其与传统 Von Neumann 结构相比有很大的区别它不但采用了不同的数据组织形式、分离了数据和指令,而且对数据访问、组指令和运算操作指令的执行模块也进行了耦解。2.1 流处理系统(SPS)模型在计算机科学领域内,流处理(stream processing)是主要应用于异构系统(isparate system)的研究技术[7]。如数据流系统(dataflow system)[8][9][10][11反馈系统(rezctive system)[12][13]、并发系统(synchronous concurrent system[14]、信号处理系统(signal processing system)[15]以及部分实时处理系统(re_time system)等都是流处理技术研究的实例。从概念上讲,这些系统都是基于流处理系统(stream processing system)研究的基础上的。从系统组成角度来看,流处理系统(SPS)包含三个组成部分:源(source向系统引入数据;滤(filter),执行一系列原子操作;漏(sink),从系统导出数结果。这三者并行工作,而相互之间则通过渠道(channel)来连接和通信,S的名字也正是由此得来。一个例子如图 2.1 所示:
X流处理器的整体框架图
图 2.3 微控制器 UC 结构框图块微代码存储器 MicroCode Store 模块用来存储核心执行的 VLIW执行的时候,MicroCode Store 模块根据 PC 把这些指令按序发icroCode Store 模块的结构如图 2.4 所示,它由微码存储模块、令排序模块组成。
【参考文献】
相关博士学位论文 前1条
1 林海波;基于EPIC体系结构的软件流水技术研究[D];清华大学;2003年
相关硕士学位论文 前1条
1 伍楠;流处理器MASA内核的研究及实现[D];国防科学技术大学;2005年
本文编号:2821530
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2821530.html