面向HPC的高性能微处理器研究进展

发布时间：2022-02-15 05:53

　　高性能计算HPC以其强大的计算能力成为关系国计民生的重要技术。作为高性能计算系统算力源泉的高性能微处理器,更是当前各国竞相争夺的技术高地,是高性能计算领域优势和实力的决定性技术。基于这一背景,以NVIDIA、Intel和AMD等主流处理器厂商面向HPC的高性能处理器架构为主要目标,从计算资源的组织方式、存储子系统设计和核间互连技术等3个关键方面展开了研究与分析,在此基础上对当前高性能微处理器的主流技术进行了总结和展望。本文的分析和结论能够为未来面向HPC的微处理器研究提供有益的参考。

【文章来源】：计算机工程与科学. 2020,42(10)北大核心CSCD

【文章页数】：7 页

【部分图文】：

面向HPC的高性能微处理器研究进展

NVIDIA A100 GPU SM结构框图

结构框图,结构框图,单元,宽度

图2给出了Ponte Vecchio GPU的结构框图,可以看出Ponte Vecchio GPU内核主要包含SIMT和SIMD 2种类型的运算单元。这样的设计完全秉承了Intel对于GPU的设计理念,即:(1)GPU的性能源泉来自其向量(Vector-SIMD)处理能力。(2)单一的Vector-SIMD宽度难以满足所有应用,且为不同宽度的Vector-SIMD所编写的代码之间存在极大的兼容性难题(摘自Intel GPU的首席架构师Koduri在HPC 开发者大会上的发言)。基于上述2个方面的考虑,Ponte Vecchio GPU中的SIMT单元主要对应较大宽度Vector-SIMD,在此基础上,作为对大宽度Vector-SIMD的补充,进一步继承了Intel CPU中medium尺寸子字SIMD(M SIMD)和Large尺寸子字SIMD(L SIMD)单元,从而进一步丰富了对Vector-SIMD的向量宽度的补充支持。Ponte Vecchio GPU中还添加了SIMT和不同尺寸SIMD单元之间的协同计算支持,即SIMT单元负责应用中较为规整的并行性开发,在此基础上,通过SIMD单元进一步加速串行部分的执行[6]。Ponte Vecchio的另一个特征是支持内核计算能力的可扩展性设计,可以根据不同应用对相应SIMT+SIMD的功能单元进行增加或删减。此外,有推测认为,SIMT单元中存在面向特定应用的专用加速部件[6]。

结构框图,结构框图,方式,资源

图3给出了NCU内部的结构框图。从图3中可以看出,NCU主要采用Scalar加Vector-SIMD的方式进行运算资源的组织。其中Scalar部分用于应用中的串行处理,Vector-SIMD部分则提供对并行部分的加速。小结:AMD GPU采用Scalar加Vector-SIMD的方式在支持并行加速的同时,兼顾对串行部分的处理。

本文编号：3626047

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3626047.html

上一篇：MES终端的嵌入式Linux软件平台技术研究
下一篇：基于Blackfin处理器ADSP-BF537的H.264视频编码器的实现与优化

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|