当前位置:主页 > 科技论文 > 计算机论文 >

流体系结构存储访问机制的研究

发布时间:2021-09-28 16:19
  流体系结构用于媒体应用以及科学计算,其在新兴的高性能计算机体系结构中备受关注。针对媒体应用以及科学计算具有计算密集性、大量并行性与局部性等特征,流体系结构将计算与访存解耦合,把计算分割成一个个核心,而连接核心的输入输出则是数据流——由同构记录按一定顺序组成的批量数据。计算与访存解耦合暴露了程序的各种并行性与局部性,使得流体系结构不但符合媒体应用以及科学计算的程序特征,也符合当今VLSI工艺的发展趋势。斯坦福大学开发的Imagine流处理器是流体系结构中的典型代表。Imagine在编程模型、编译架构、硬件结构上采用了“核心级-流级”两级模型,较彻底地解耦合了计算与访存,能广泛深入挖掘程序的各种并行性与局部性。因此,我们把Imagine作为主要研究对象来研究流体系结构的具体运行机制。本文将着重研究流体系结构的存储访问机制。本文明确了流处理的基本概念,并以Imagine为例简要介绍流体系结构的软硬件组成。本文通过与传统微处理器的比较,从程序设计模式、存储层次、以及编译优化等角度详细讨论流体系结构存储访问机制的优点。本文研究了基于数据级并行的流存储系统的设计,并对其进行了改进,进一步提高了实际... 

【文章来源】:国防科技大学湖南省 211工程院校 985工程院校

【文章页数】:69 页

【学位级别】:硕士

【部分图文】:

流体系结构存储访问机制的研究


深度萃取的流处理过程

流体系结构存储访问机制的研究


NUCA结构

寄存器文件,资源分配


3.3.2编译对SRF的分配使用在流体系结构中,编译对片内存储SRF的分配使用(以下称流调度算法)按时间与空间两个维度进行,如图3.6所示:横轴代表S好空间,以S好的块大小为基本刻度;纵轴以高级流操作为基本刻度,表示时间。流调度11’]的基本思想是首先确定每个流访问所需s盯空间的大小;然后,根据相容性原则对这些流访问进行分类,从而形成一个个具有起止时间、空间大小双重属性的对空易劝(Buffer),用于捕获同一流的多次引用;最后,采用各种办法将这些缓冲尽可能“紧致”地安放在如图3.6所示的长方形中(称为对空SRF)。作为片内存储的SRF从某种意义上可以认为是“流”的Cache。传统Cache的淘汰策略多为 LRU(LeastRecentUsed),但是LRU策略不能很有效地捕获编程模型所暴露出的对同一流的多次引用


本文编号:3412252

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3412252.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户69636***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com