众线程宽向量体系结构建模与性能分析
发布时间:2018-02-28 05:40
本文关键词: MTV体系结构 模拟器 多线程 向量 出处:《国防科学技术大学》2012年硕士论文 论文类型:学位论文
【摘要】:随着单核微体系结构的不断改进,程序的指令级并行性已基本上开发殆尽,目前国际上微处理器的主要发展方向是发掘程序的任务级并行性和数据级并行性。本文试图在传统的单核体系结构基础上,深入发掘任务级并行性和数据级并行性,从多个层面提升微处理器性能。本文提出了面向科学计算的众线程宽向量(Many-Thread wide Vector,MTV)体系结构,能够同时开发程序的指令级并行性、任务级并行性和数据级并行性。 本文的主要工作包括两个方面,即MTV体系结构建模和MTV体系结构的性能分析。 首先,本文对MTV体系结构进行了功能建模和性能建模,,形成了一款执行驱动的MTV体系结构全系统模拟器。功能建模方面,该模拟器建模了MTV体系结构的寄存器、存储器和指令执行引擎,支持引导未经修改的操作系统,并且采用了指令译码缓冲和地址翻译缓冲等多种优化技术提升性能。性能模拟方面,建模了一条支持硬件多线程的乱序执行流水线,建模了分支预测、乱序执行、硬件多线程、Cache层次和片上互连网络等多种微体系结构部件。MTV模拟器采用模块化设计思想,利用动态链接技术,实现了模拟器各部件模型的动态加载,使得模拟器具有很高的灵活性。 其次,本文在MTV模拟器内实现了一个片上存储系统的Profiling框架,并在此基础上对MTV体系结构的存储系统进行了初步研究和性能分析,包括多线程对访存延迟的容忍程度和向量存储对存储结构的影响两个方面。基于对实验数据的分析,提出了一种适合标量和向量混合存储的存储器改进方案,并进行了一定的性能分析。
[Abstract]:With the continuous improvement of the single-core microarchitecture, the instruction level parallelism of the program has basically been developed. At present, the main development direction of microprocessor in the world is to explore the task level parallelism and data level parallelism of programs. This paper attempts to explore the task level parallelism and data level parallelism on the basis of the traditional single core architecture. In this paper, we propose a multithread wide vector many-Thread wide VectorMTV architecture for scientific computing, which can simultaneously develop the command level parallelism, task level parallelism and data level parallelism of programs. The main work of this paper includes two aspects: modeling of MTV architecture and performance analysis of MTV architecture. First of all, the function modeling and performance modeling of MTV architecture are carried out, and an executive-driven MTV architecture full-system simulator is formed. In terms of functional modeling, the simulator models the register of MTV architecture. Memory and instruction execution engine, supporting the boot of unmodified operating system, and using a variety of optimization techniques such as instruction decoding buffer and address translation buffer to improve performance. In this paper, we model pipeline, which supports hardware multithreading, model branch prediction, scramble execution, hardware multithreading Cache hierarchy and on-chip interconnection network. MTV simulator adopts modularization design idea. The dynamic link technology is used to realize the dynamic loading of each component model of the simulator, which makes the simulator have high flexibility. Secondly, a Profiling framework of on-chip storage system is implemented in the MTV simulator, and the storage system of MTV architecture is studied and analyzed on this basis. This paper includes two aspects: the tolerance of multithreading to memory access delay and the effect of vector storage on memory structure. Based on the analysis of experimental data, a memory improvement scheme suitable for scalar and vector hybrid storage is proposed. A certain performance analysis was carried out.
【学位授予单位】:国防科学技术大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP332
【参考文献】
相关期刊论文 前8条
1 王晔;臧斌宇;朱传琪;;二维SIMD体系结构研究与模拟器实现[J];计算机工程与应用;2007年25期
2 路放;安虹;梁博;任建;;OpenSMT:一个同时多线程处理器模拟器的设计和实现[J];计算机科学;2006年01期
3 钱兴隆;臧斌宇;朱传琪;;一种SIMD优化中的向量寄存器部分重用方法[J];计算机工程与科学;2007年05期
4 李莉,沈绪榜;LSSIMD阵列微处理器的控制逻辑设计[J];计算机学报;2000年05期
5 陈朝阳,王忠,沈绪榜,桑红石,赵冰茹,陈小铁;LS MPP并行图像处理机[J];计算机学报;2002年03期
6 李祖松;许先超;胡伟武;唐志敏;;龙芯2号处理器的同时多线程设计[J];计算机学报;2009年11期
7 佟冬,方滨兴,胡铭曾;用非线性存储方案设计SIMD计算机的一般方法[J];计算机研究与发展;2000年02期
8 刘坤杰;秦兴;严晓浪;李德贤;彭剑英;;EDO-SIMD:内嵌数据组织的SIMD多媒体扩展指令集[J];浙江大学学报(工学版);2008年04期
相关博士学位论文 前1条
1 欧国东;基于线程的数据预取技术研究[D];国防科学技术大学;2011年
本文编号:1545992
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1545992.html