流体系结构指令管理及系统虚拟化仿真技术研究
【图文】:
(d)二维相关矩阵:流场 (e) 高速图像变换与目标识别 (f)生物计算:分子动力学图 1.1 计算密集型应用领域大量的数据级并行。应用程序中数据处理过程中相互间的依赖度很低,且通常核心程序需要在大量的数据集合上执行相同的操作,这使得大量的数据可以被同时处理。如流体力学中解恒定流场的偏微分方程时,各个通量可以并行处理,每个通量的各个节点数据也可以被并行处理。另外,在媒体应用中,存在大量 8bit、16bit 等低精度类型的数据,为了节省硬件开销,多个低精度的数据通常被合成一个高精度的数据同时处理,这种子字并行的方式[10]也成为数据级并行的另一种体现。数据级并行要求处理器具有高效的开发数据级并行性的硬件机制。生产者-消费者局域性。数据访问具有典型的流式特征,即一个计算核心产生的运算结果将作为后续核心的输入数据集。与传统应用中存在的时间和空间局域性不同,生产者-消费者数据局域性不符合 LRU (Least RecentlyUsed)规则,因此,Cache 不能有效的利用该数据访问特性,甚至可能阻碍系统性能的提升[11]。生产者-消费者局域性要求处理器具有合理的存储层
国防科学技术大学研究生院博士学位论文长。随着芯片上可集成的晶体管数目呈指数级增长,截至目前,半导体工备单片集成数十亿支晶体管的能力[14],例如 Intel 公司推出的下一代 Itanium器(Tukwila)将集成 20 亿支晶体管[15]。并且根据国际半导体技术路线机构(ITernational Technology Roadmap for Semiconductors)[16]2009 年预测,2016 年以处理器芯片集成的晶体管数目将接近百亿,如图 1.2[16]所示。半导体工艺的动微处理器进入十亿支晶体管体系结构(BTAs: Billion-Transistor Architectur代,为系统设计者提供了大量的硬件资源用于构建更高性能处理芯片,也处理器体系结构设计带来了新的机遇与挑战。日益增加的晶体管资源给处理器提供了广阔的发展空间,,但随着处理器断增大,芯片设计和验证将变得日益复杂,面对这些问题,未来的处理器构将更偏向于结构上的层次化和功能上的模块化与分布化的设计理念[14]。因称多核、众核以及 clustered 等体系结构被广泛关注。它们采用资源复制的方仅能更有效的利用芯片上的晶体管资源,而且其规模可根据应用的性能需扩展,更有利于提高处理器性能。
【学位授予单位】:国防科学技术大学
【学位级别】:博士
【学位授予年份】:2010
【分类号】:TP332
【参考文献】
相关期刊论文 前7条
1 赖明澈;王志英;戴葵;高蕾;;基于代码特征分析的TTA指令压缩技术与解压部件实现[J];电子学报;2008年11期
2 张春元;文梅;伍楠;荀长庆;吴伟;;二维拉格朗日和欧拉结合法在流处理器MASA上的实现与评测[J];国防科技大学学报;2006年04期
3 王世好,王歆民,刘明业;嵌入式系统软硬件协同验证中软件验证方法[J];计算机研究与发展;2005年03期
4 李勇;王志英;赵学秘;岳虹;;配置流驱动计算体系结构指导下的ASIP设计[J];计算机研究与发展;2007年04期
5 何义;任巨;文梅;杨乾明;伍楠;张春元;郭敏;;适用于SIMD体系结构的FPGA分页仿真模型研究[J];计算机研究与发展;2011年01期
6 何义;任巨;杨乾明;管茂林;文梅;张春元;;可配置流处理器核心级指令设计及相关编译技术研究[J];计算机工程与科学;2009年11期
7 刘必慰;陈书明;汪东;;先进微处理器体系结构及其发展趋势[J];计算机应用研究;2007年03期
相关博士学位论文 前4条
1 文梅;流体系结构关键技术研究[D];国防科学技术大学;2006年
2 晏小波;FT64流处理技术:体系结构、编程语言、编译技术及编程方法[D];国防科学技术大学;2007年
3 邓宇;基于图着色的存储层次优化技术研究[D];国防科学技术大学;2007年
4 伍楠;高效能流体系结构关键技术研究[D];国防科学技术大学;2008年
相关硕士学位论文 前1条
1 杨乾明;多核流体系结构模拟器研究与实现[D];国防科学技术大学;2008年
本文编号:2708532
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2708532.html