多核处理器中NUCA搜索策略及性能评价技术研究
【文章页数】:62 页
【学位级别】:硕士
【部分图文】:
图2.4Cell处理器顶层结构[,“]
国防科学技术大学研究生院学位论文4位ePu内核PPE和8个浮点处理用的32位8路SIMD型CpU内核sPE(s”ergistroeessingElement)。片内有一个高带宽的环状高速总线(EIB)把PPE,sPE及以MBu内存接口控制器(MIC),Flexl/O外部总线接口控....
图2.6几种二级Cache结构
国防科学技术大学研究生院学位论文级Caehe,称为ML一UCA(Multi一levelUniformCaeheAiehiteeture),该图中LZ和L3Caehe都划分为体以支持多个并行访问。图2.6c给出的是分体(Bank)的非一致访问Cache,对不同体的访问延迟不....
图2.7D一NUCA结构的映射根据Kim的性能评测结果!‘9],在单处理器环境中,相对于传统的均匀访问延迟的cache
国防科学技术大学研究生院学位论文所在体的问题。D一NUCA设计了增量查找和广播查找两种方式。增量查找每次查找一个体,缺失后将查找请求传送到下一个体,这种方式的网络流量和功耗开销较小,但查找时间较长。广播方式一次将查找请求发送到体组内所有的体,查找过程大致是并行的,可以在最短时间内....
图2.8CMPD一NUCA结构
国防科学技术大学研究生院学位论文C)提供了快速、接近一致的访问延迟。然而,传输线的有限带宽(来自其大MP中可能导致性能瓶颈。BeekmanLn给出的是采用45nml艺的8核CMP芯片设计,如图2.8所示。CMPD分离的指令Caehe和数据Caehe,容量为64KB;LZCaehe....
本文编号:4012529
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/4012529.html
下一篇:没有了