当前位置:主页 > 科技论文 > 计算机论文 >

多核处理器中NUCA搜索策略及性能评价技术研究

发布时间:2024-11-24 22:00
  在工艺和应用的双重推动下,片上多核处理器成为当前高性能微处理器的发展趋势。多核对单芯片有限Cache、带宽等存储资源的竞争将进一步凸显访存的瓶颈,同时伴随着更加多样的目标应用,微体系结构研究采用的性能评价环境面临新的要求。本文的研究主要围绕多核处理器中存储层次——NUCA结构的性能优化和多核处理器的性能模拟技术展开,工作涵盖了结构逻辑设计和模拟平台建设两个方面。 为了缓解多核对访存的压力,多核处理器普遍采用在片上集成大容量Cache的方式来提高存储系统的性能。本文研究了管理大容量片上Cache的NUCA技术,改进了用于片上多核处理器中NUCA结构的搜索策略。现有的搜索策略或承受着很大的性能损失或具有过高的存储空间要求。本文采用的策略基于Bloom Filter,是一种复杂性有效的搜索机制,有效的利用了晶体管的数量并且不需要更改基本的一致性协议。它降低了多核处理器NUCA结构的存储要求并对其性能也有所改进,对未来工作具有指导意义。 随着处理器结构的发展和新应用的出现,采用全系统模拟将是今后微体系结构研究的必然趋势。本文研究了全系统环境下的多核处理器模拟技术,详细分析多核全系统模...

【文章页数】:62 页

【学位级别】:硕士

【部分图文】:

图2.4Cell处理器顶层结构[,“]

图2.4Cell处理器顶层结构[,“]

国防科学技术大学研究生院学位论文4位ePu内核PPE和8个浮点处理用的32位8路SIMD型CpU内核sPE(s”ergistroeessingElement)。片内有一个高带宽的环状高速总线(EIB)把PPE,sPE及以MBu内存接口控制器(MIC),Flexl/O外部总线接口控....


图2.6几种二级Cache结构

图2.6几种二级Cache结构

国防科学技术大学研究生院学位论文级Caehe,称为ML一UCA(Multi一levelUniformCaeheAiehiteeture),该图中LZ和L3Caehe都划分为体以支持多个并行访问。图2.6c给出的是分体(Bank)的非一致访问Cache,对不同体的访问延迟不....


图2.7D一NUCA结构的映射根据Kim的性能评测结果!‘9],在单处理器环境中,相对于传统的均匀访问延迟的cache

图2.7D一NUCA结构的映射根据Kim的性能评测结果!‘9],在单处理器环境中,相对于传统的均匀访问延迟的cache

国防科学技术大学研究生院学位论文所在体的问题。D一NUCA设计了增量查找和广播查找两种方式。增量查找每次查找一个体,缺失后将查找请求传送到下一个体,这种方式的网络流量和功耗开销较小,但查找时间较长。广播方式一次将查找请求发送到体组内所有的体,查找过程大致是并行的,可以在最短时间内....


图2.8CMPD一NUCA结构

图2.8CMPD一NUCA结构

国防科学技术大学研究生院学位论文C)提供了快速、接近一致的访问延迟。然而,传输线的有限带宽(来自其大MP中可能导致性能瓶颈。BeekmanLn给出的是采用45nml艺的8核CMP芯片设计,如图2.8所示。CMPD分离的指令Caehe和数据Caehe,容量为64KB;LZCaehe....



本文编号:4012529

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/4012529.html

上一篇:计算机公共基础课“课程思政”教学探索  
下一篇:没有了

Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d88ab***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com