基于亚字并行技术的128位SIMD算术单元设计
本文关键词:基于亚字并行技术的128位SIMD算术单元设计,由笔耕文化传播整理发布。
【摘要】:在现代处理器设计中,随着多媒体处理、DSP信号处理、3D图形处理的广泛应用,支持SIMD计算的向量运算单元越来越突出其重要的地位。向量运算单元往往具有较大的实现面积,同时大多也处于计算的关键路径之中,其设计方案直接影响着整个CPU的性能。本文针对IBM的POWER处理器的128位SIMD复杂向量算术(Vector Complex)指令架构,给出了一种高性能的基于亚字并行技术的实现方案。本文的128位SIMD算术单元兼容POWER指令集中的27条向量类指令,包括向量乘、向量乘加/乘累加和向量累加3大类指令,支持定点饱和操作,运算过程在6个时钟周期内完成。本设计由3大部分组成:亚字并行乘加器、选择部件和累加器,其中设计的核心部件是亚字并行乘加器。根据指令集的功能,SIMD算术单元需要实现4个32-bit的亚字并行乘加器。每个乘加器支持1个32×32-bit,2个16×16-bit或者4个8×8-bit的有符号/无符号操作,其中在8-bit模式下还支持混合符号(有符号×无符号)操作,并且在16-bit模式下支持有符号操作的饱和判断。本文对亚字并行乘加器的关键部件进行了详细的设计,每个部件都给出了多种实现方法。部分积生成部件给出了2种实现方法,其中,混合亚字并行法的实现不用考虑进位链的传播,相应的压缩器和加法器也得到简化,电路逻辑简单;布思选择法可以使部分积的数目减少一半,大大减少压缩时电路的时延。压缩部件的实现,首先对3-2压缩器和4-2压缩器进行改进使其适应3种模式的压缩,并采用改进型的Wallace树型结构进行压缩,压缩部件只需增加少量控制逻辑就能在支持多种模式的同时而不增加额外的时延。加法器的结构选择了综合性能突出的LF并行前缀加法器,对其采用进位截断机制实现亚字并行功能。饱和判断部分,给出了基础加减法饱和判断方法,并对其经行了优化,接着分析了乘加运算预判断溢出技术,并结合指令集给出了适合本设计的饱和判断方法。按照本文给出的亚字并行技术,可以以较小的实现代价完成任意位宽的高性能乘/乘加单元。本设计为6级流水线结构,使用UVM平台进行验证,在DC综合工具的环境及使用0.18μm SIMC工艺库下,128位SIMD算术单元的面积为590015(μm2),最高频率可达350MHz。对比普通乘加器,本设计的亚字并行乘加器可实现多种复杂的向量算术运算。综合结果表明,较之普通乘加器,时延只增加了9.1%,同时面积只增加了5.9%。在SIMD运算中,和传统的乘法/乘加器相比,本文提出的高性能亚字并行技术具有明显的技术优势,能够满足各种高性能CPU的向量计算要求。
【关键词】:SIMD 亚字并行 乘/乘加 booth算法 加法
【学位授予单位】:西安电子科技大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP332.2
【目录】:
- 摘要5-6
- ABSTRACT6-11
- 缩略语对照表11-14
- 第一章 绪论14-20
- 1.1 研究背景与意义14-15
- 1.2 亚字并行SIMD运算部件的主要研究现状15-18
- 1.2.1 加法算法15-16
- 1.2.2 乘法算法16-17
- 1.2.3 有限域乘法算法17-18
- 1.3 论文的主要工作和组织18-20
- 第二章 SIMD算术单元涉及的相关理论20-32
- 2.1 基本乘法理论20-22
- 2.1.1 无符号乘法20
- 2.1.2 有符号乘法20-22
- 2.2 布思算法22-27
- 2.2.1 基2布思算法22-23
- 2.2.2 基4布思算法23-27
- 2.3 压缩器27-31
- 2.3.1 3-2 压缩器27-28
- 2.3.2 4-2 压缩器28-31
- 2.4 小结31-32
- 第三章 SIMD算术单元的总体设计32-38
- 3.1 SIMD算术单元所支持的指令集32-34
- 3.2 SIMD算术单元的总体设计34-38
- 第四章 SIMD算术单元关键部件设计38-70
- 4.1 亚字并行乘加器设计38-65
- 4.1.1 亚字并行乘加部分积生成39-48
- 4.1.2 加数生成器48-49
- 4.1.3 部分积压缩器49-53
- 4.1.4 亚字并行加法器53-59
- 4.1.5 饱和判断单元59-65
- 4.2 选择器功能部件65
- 4.2.1 select4选择器65
- 4.2.2 select0-3 选择器65
- 4.3 累加器设计65-69
- 4.3.1 加数扩展67
- 4.3.2 压缩操作数67
- 4.3.3 加法器67-68
- 4.3.4 饱和判断68-69
- 4.4 小结69-70
- 第五章 SIMD算术单元的流水线设计与验证综合70-84
- 5.1 SIMD算术单元的流水线设计70-74
- 5.1.1 流水线设计策略70-72
- 5.1.2 算术单元的流水线设计72-74
- 5.2 SIMD算术单元的验证74-77
- 5.2.1 UVM验证方法学74-75
- 5.2.2 算术单元的验证75-77
- 5.3 SIMD算术单元的综合77-82
- 5.3.1 综合概述及综合策略77-79
- 5.3.2 算术单元的综合79-82
- 5.4 小结82-84
- 第六章 总结与展望84-86
- 6.1 对本设计的总结84
- 6.2 进一步的工作84-86
- 参考文献86-88
- 致谢88-90
- 作者简介90-91
【相似文献】
中国期刊全文数据库 前10条
1 张为华;臧斌宇;王晔;钱兴隆;朱传琪;;基于共享向量的二维SIMD调度算法[J];计算机学报;2006年10期
2 李璞;孙亚辉;;64位环境SIMD性能优化技术研究[J];计算机与信息技术;2007年04期
3 卜士喜;竺红卫;;软件SIMD的研究及应用[J];计算机工程;2010年19期
4 侯永生;赵荣彩;黄磊;韩林;;面向SIMD扩展部件的循环优化研究[J];计算机科学;2014年05期
5 张为华;臧斌宇;;共享主存多SIMD结构及编译技术研究[J];计算机科学与探索;2009年01期
6 郭阳;丁伟;李振涛;;高性能算术SIMD模块的电路设计[J];微电子学与计算机;2010年09期
7 侯永生;赵荣彩;高伟;朱嘉枫;;SIMD扩展部件数据依赖关系约束条件研究[J];信息工程大学学报;2014年01期
8 吴松,章勇,姚庆栋;嵌入式SIMD控制核的设计研究[J];浙江大学学报(工学版);2001年02期
9 周西汉,刘勃,周荷琴,袁非牛;一种基于奔腾SIMD指令的快速背景提取方法[J];计算机工程与应用;2004年27期
10 张倩;;二维SIMD结构的低功耗调度[J];计算机工程;2009年10期
中国重要会议论文全文数据库 前7条
1 梅家祥;王永文;邢座程;;SIMD模式下访存单元的验证[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年
2 付光远;;基于SIMD-MPP并行模型的图像调度与映射方法研究[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年
3 高巍;宋妍;;基于SIMD体系结构的数据相关控制语句转化方法[A];2009年全国开放式分布与并行计算机学术会议论文集(上册)[C];2009年
4 朱明慧;;ADI浮点DSP软件编程中的指令并行与SIMD应用[A];中国航空学会信号与信息处理专业全国第八届学术会议论文集[C];2004年
5 李彦洁;庞一;孙立峰;;多视点视频编码中的SIMD优化研究[A];第四届和谐人机环境联合学术会议论文集[C];2008年
6 Liangchun Xu;Hongping Zhang;Wenfei Guo;Di Zhang;;A new SIMD correlatoralgorithm for GNSS software receivers toprocess complex IF data[A];第四届中国卫星导航学术年会论文集-S7 北斗/GNSS用户终端技术[C];2013年
7 吴铁彬;刘衡竹;杨惠;张剑锋;侯申;;一种快速SIMD浮点乘加器的设计与实现[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(B辑)[C];2011年
中国博士学位论文全文数据库 前8条
1 杨惠;面向性能的SIMD DSP指令流调度技术研究[D];国防科学技术大学;2014年
2 侯永生;多重循环SIMD向量化方法及性能优化技术研究[D];解放军信息工程大学;2014年
3 张为华;共享主存多SIMD结构编译优化及结构研究[D];复旦大学;2006年
4 李玉祥;面向非多媒体程序的SIMD向量化方法及优化技术研究[D];中国科学技术大学;2008年
5 张凯;向量SIMD DSP上高效矩阵运算技术研究[D];国防科学技术大学;2013年
6 朱嘉华;SIMD编译优化方法研究[D];复旦大学;2005年
7 姜伟华;针对实际多媒体程序和多媒体扩展指令集的SIMD编译优化[D];复旦大学;2005年
8 魏帅;面向SIMD的向量化算法及重组技术研究[D];解放军信息工程大学;2012年
中国硕士学位论文全文数据库 前10条
1 黄胜兵;面向BWDSP的SIMD编译优化技术研究与实现[D];中国科学技术大学;2016年
2 胡辰;基于异构SIMD并行的高分辨率星载SAR原始数据快速模拟研究[D];北京化工大学;2016年
3 李国君;基于异构SIMD并行的高分辨率星载SAR快速成像研究[D];北京化工大学;2016年
4 徐沛文;32位高性能DSP SIMD向量存储器的设计和验证[D];国防科学技术大学;2015年
5 单佳坤;基于亚字并行技术的128位SIMD算术单元设计[D];西安电子科技大学;2016年
6 张倩;二维SIMD结构的低功耗调度[D];复旦大学;2008年
7 李璋辉;支持浮点融合乘加的SIMD运算部件设计优化及实现[D];国防科学技术大学;2013年
8 杨明;基于存储访问的SIMD优化技术研究[D];解放军信息工程大学;2011年
9 刘楷;基于SIMD结构的高性能DSP处理器评测程序的优化与实现[D];西安电子科技大学;2012年
10 陈向;SIMD数据置换指令的自动生成与优化[D];国防科学技术大学;2010年
本文关键词:基于亚字并行技术的128位SIMD算术单元设计,,由笔耕文化传播整理发布。
本文编号:255499
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/255499.html