支持推测并行化的可扩展事务存储体系结构设计与性能评价
发布时间:2020-05-20 16:16
【摘要】: 片上多核作为当今处理器设计的主流技术,依赖多线程应用来充分发挥性能优势。但是传统的并行编程在编程效率与正确性方面却存在问题,严重制约了对多核平台上大量计算资源的利用。事务存储与线程级推测技术分别从显式并行编程的同步与串行程序的并行化两个方面入手解决传统多线程编程的困难。它们均通过激进地并行执行来充分挖掘程序中更多的并行性,并利用硬件进行动态数据依赖检测以保证结果的正确性、简化编程。现有的研究往往仅专注于其中一种技术,通过复杂的硬件结构来获取有限的性能提升。尤其是现有的线程级推测方案,大都使用了紧耦合的结构设计与复杂的缓存机制。本文通过从这两种技术的语义模型中抽取出共同特征,尝试设计一种具有较好可扩放性并易于实现的硬件支持方案,在其上可以高效地支持推测并行与手工并行,为程序员提供丰富的语义支持以简化并行编程的复杂度。 本文在事务存储与线程级推测技术的统一硬件支持方面展开了深入系统的研究,主要的研究成果包括:(1)提出了支持推测并行化的可扩展事务存储抽象硬件结构模型LogSPoTM,并为该抽象模型提供了一个易于硬件实现的方案及其配套软件环境。在这套推测系统上并行化程序执行需要调整的代码很少,达到了简化并行编程的目的。(2)选取若干个具有不同访存行为模式的典型应用程序,对影响LogSPoTM实现方案性能的关键因素进行了详细的评估,分析了一些设计选择对LogSPoTM实现复杂度与性能的影响。(3)针对软件模拟器速度缓慢给研究工作带来的限制,本文最后基于HAsim硬件模拟框架,设计了LogSPoTM的硬件模拟环境,可以将模拟速度提高2~3个数量级。与一般的硬件原型系统的仿真验证环境设计不同,这里的硬件模拟环境是一个高度可配置的研究型模拟器,具有良好的可观测性。 在设计评测LogSPoTM结构模型与配套支持系统的过程中,我们得到了一些关于如何有效利用线程级推测技术的认识。首先,为了提升推测执行性能,我们认为更多的努力应当投入到软件优化方面,而不是激进地调整硬件结构和执行机制。利用编译器识别应用的依赖特征、访存模式与迭代粒度等特性,对代码变换的优化应可以起到较好的效果。其次,线程级推测只在部分应用程序上获得最佳的效果,因而并不能让自动并行完全取代手工并行,但可以作为手工并行的辅助工具来使用。
【学位授予单位】:中国科学技术大学
【学位级别】:硕士
【学位授予年份】:2009
【分类号】:TP333
本文编号:2672873
【学位授予单位】:中国科学技术大学
【学位级别】:硕士
【学位授予年份】:2009
【分类号】:TP333
【引证文献】
相关博士学位论文 前2条
1 王耀彬;多核平台上支持推测并行化的事务存储体系结构性能优化[D];中国科学技术大学;2010年
2 李颀;基于FPGA的片上多处理器建模方法[D];中国科学技术大学;2012年
相关硕士学位论文 前1条
1 代文博;减少推测多线程回退的片上网络优化设计与分析[D];中国科学技术大学;2011年
,本文编号:2672873
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2672873.html