时钟共享多线程处理单元的设计与实现
发布时间:2017-04-05 23:00
本文关键词:时钟共享多线程处理单元的设计与实现,,由笔耕文化传播整理发布。
【摘要】:自集成电路诞生以来,单片集成电路的晶体管数目越来越多,处理器的工作主频也越来越高,随之而来的功耗问题越来越明显。传统的处理器体系结构面临瓶颈,增加晶体管数目、提升工作主频已经不能满足人们对处理器的需求。此后,出现了多线程技术与多核技术,两种技术各有优缺点,但是多核技术与多线程技术的结合却使处理器的性能获得了更高的提升。这种结构的处理器,结构简单,可塑性强,并行度高,同时利用线程切换的原理解决了微处理器核之间通信带来的延时。可以说多核技术与多线程技术的结合给处理器的发展注入了新的活力,给未来处理器的研究指引了方向。时钟共享多线程处理器正是在这种背景下提出的一种多核多线程且具有特定功能的处理器,且包含多种运行模式,支持指令级并行、线程级并行和数据级并行。处理单元作为时钟共享多线程处理器的主要功能单元,需要有良好的设计来支持处理器的这些特性。本文研究并实现了时钟共享多线程处理器中的处理单元设计,主要工作包括:1.分析了国内外并行处理器及并行处理技术,研究了时钟共享多线程处理器的体系结构和功能要求。2.按照时钟共享多线程处理器的要求,设计实现了基于同时多线程技术,带有阻塞和非阻塞模式,能够进行线程间和核间通信的处理单元。3.搭建了包含前端控制器、处理单元、线程管理器和协处理器的仿真测试平台,对处理单元进行了系统级的功能仿真与验证。实验结果表明,所设计的处理单元除了能够完成时钟共享多线程处理器所要求的算术逻辑运算、特殊函数运算外,还能够进行数据的线程间通信与核间通信。同时,利用同时多线程技术提高了处理器执行资源的利用效率和吞吐量。最后,选用Xilinx公司的Virtex7 XC7V2000T型FPGA开发板对处理单元进行了验证,检查了电路工作性能,工作频率达152MHz,满足设计要求。
【关键词】:阵列处理器 多核多线程 处理单元 同时多线程 数据通信
【学位授予单位】:西安邮电大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP332
【目录】:
- 摘要3-4
- ABSTRACT4-8
- 第1章 绪论8-12
- 1.1 课题的研究背景与意义8-9
- 1.2 国内外研究现状9-10
- 1.2.1 国外研究现状9
- 1.2.2 国内研究现状9-10
- 1.3 论文的主要工作及组织结构10-12
- 1.3.1 论文主要工作10
- 1.3.2 论文组织结构10-12
- 第2章 并行处理器相关技术12-20
- 2.1 计算机分类12-14
- 2.2 并行处理技术14-15
- 2.3 指令级并行和数据相关性15-17
- 2.3.1 指令级并行(ILP)15-16
- 2.3.2 指令相关性16-17
- 2.4 数据级并行(DLP)17
- 2.5 线程级并行(TLP)和同时多线程(SMT)17-18
- 2.6 并行技术比较18-19
- 2.7 分析和总结19-20
- 第3章 时钟共享多线程处理器介绍及其处理单元的总体设计20-26
- 3.1 时钟共享多线程处理器介绍20-21
- 3.1.1 时钟共享多线程处理器结构20-21
- 3.1.2 时钟共享多线程处理器运行模式21
- 3.2 处理单元总体设计21-25
- 3.2.1 指令集系统结构(ISA)21-22
- 3.2.2 指令字编码22
- 3.2.3 处理单元结构22-24
- 3.2.4 数据通信24-25
- 3.3 分析和总结25-26
- 第4章 处理单元的详细设计与实现26-44
- 4.1 指令预取26-27
- 4.2 译码单元27-34
- 4.2.1 指令乒乓27-28
- 4.2.2 指令解析28-30
- 4.2.3 PC控制30-31
- 4.2.4 阻塞处理31-33
- 4.2.5 输出控制33-34
- 4.3 指令调度器34-36
- 4.4 地址流水线36-38
- 4.5 存储管理38-43
- 4.5.1 交叉存储结构38-39
- 4.5.2 指令交叉存储39-41
- 4.5.3 数据交叉存储41-43
- 4.6 分析和总结43-44
- 第5章 功能仿真和综合44-50
- 5.1 功能仿真44-48
- 5.1.1 指令预取测试44
- 5.1.2 基本指令测试44-46
- 5.1.3 线程间通信46-47
- 5.1.4 核间通信(近邻通信)47-48
- 5.2 综合报告48-49
- 5.3 分析和总结49-50
- 第6章 总结和展望50-52
- 6.1 总结50
- 6.2 展望50-52
- 参考文献52-54
- 附录 指令集54-56
- 攻读学位期间取得的研究成果56-58
- 致谢58-59
【参考文献】
中国期刊全文数据库 前2条
1 沈绪榜;;阵列处理器系统芯片的发展[J];电子产品世界;2010年Z1期
2 李涛;杨婷;易学渊;蒲林;钱博文;黄光新;黄虎才;韩俊刚;;萤火虫2:一种多态并行机的硬件体系结构[J];计算机工程与科学;2014年02期
中国博士学位论文全文数据库 前1条
1 韦健;低功耗逻辑电路设计及在RISC设计中的研究[D];浙江大学;2001年
中国硕士学位论文全文数据库 前2条
1 陈英豪;基于RISC体系结构的处理器设计与RTL级实现[D];北京邮电大学;2006年
2 张晗;基于32位RISC体系结构的微处理器设计与研究[D];西安电子科技大学;2011年
本文关键词:时钟共享多线程处理单元的设计与实现,由笔耕文化传播整理发布。
本文编号:287804
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/287804.html