基于节点预测的直接Cache一致性协议
本文关键词: 单芯片多处理器(CMP) 预测 一致性协议 目录 可扩展 出处:《计算机学报》2014年03期 论文类型:期刊论文
【摘要】:处理器性能的提升依赖于对存储系统性能的挖掘.随着片上集成内核数量的不断增大和特征尺寸的持续缩小,延迟、存储可扩展的Cache一致性协议已经成为提升访存效率的关键性因素.文中提出一种基于节点预测的直接Cache一致性协议-NPP协议,研究一致性交互延迟隐藏和目录存储开销减少技术.针对读、写缺失中存在的间接性问题和现有解决方案破坏已有数据局部性、无法获得最近数据副本等问题,分别提出节点挂起技术和直接写缺失处理技术,有效隐藏了目录访问延迟.为了实现准确的节点预测,作者还提出基于"签名"回收的历史信息更新算法,避免了冗余更新和不完整更新.使用SPLASH-2测试程序集,在基于2D MESH NoC互联的64核CMP下,相对于全映射目录协议,NPP协议的平均执行时间降幅为21.78%~31.11%;平均读缺失延迟降低14.22%~18.9%;平均写缺失延迟降低17.89%~21.13%.而获得上述性能提升的代价是网络流量平均增加6.62%~7.28%.
[Abstract]:The improvement of processor performance depends on the mining of storage system performance. With the increasing number of on-chip integrated cores and the continuous reduction of feature size, delay. The storage extensible Cache conformance protocol has become the key factor to improve the memory access efficiency. In this paper, a direct Cache conformance protocol-NPP protocol based on node prediction is proposed. Aiming at the indirect problem in reading and writing missing and the existing solutions which destroy the existing data locality and can not get the most recent data copy etc research on consistent interactive latency hiding and directory storage cost reduction. In order to realize accurate node prediction, the author also proposes an update algorithm of historical information based on "signature" recycling. Avoid redundant updates and incomplete updates. Using SPLASH-2 test assemblies, under 64-core CMP based on 2D MESH NoC interconnection, relative to the full-mapping directory protocol. The average execution time of NPP was 21.78% and 31.11% respectively. The average delayed reading loss decreased 14.2222% and 18.9%; The average write loss delay decreases 17.89% and 21.13%. The cost of achieving the above performance gains is an average increase in network traffic of 6.62% and 7.28%.
【作者单位】: 中国航空工业集团公司西安航空计算技术研究所;西安交通大学电子与信息工程学院;
【基金】:国家“核高基”科技重大专项(2009ZX01039-003-001-03,2009ZX01023-004) 国家自然科学基金(60905007)资助~~
【分类号】:TP332
【正文快照】: 1引言良好的可扩展性和对芯片面积的高效利用促使CMP处理器(Chip Multi-Processor)被广泛使用.然而,芯片上连线的电气特性不可能与半导体工艺等比例缩放,线延迟问题已经成为未来CMP设计的重要限制因素[1-2].研究者提出延迟非一致的Cache访问(Non-Uniform Cache Access,NUCA)[3
【参考文献】
相关期刊论文 前3条
1 黄安文;张民选;;多核处理器Cache一致性协议关键技术研究[J];计算机工程与科学;2009年S1期
2 胡伟武,施巍松,唐志敏;基于新型Cache一致性协议的共享虚拟存储系统[J];计算机学报;1999年05期
3 王钰;;多机可缩放性高速缓冲存储器一致性协议分析[J];计算机技术与发展;2009年02期
【共引文献】
相关期刊论文 前10条
1 谢青峰;浅析高速缓冲存储器Cache在PC系统中的应用[J];福建电脑;2004年09期
2 章隆兵,陈意云,章锋,陈国良;基于分布式共享存储系统的并行文件子系统DPFS[J];计算机研究与发展;2002年03期
3 姚念民,舒继武,郑纬民;SAN中的分布式锁机制[J];计算机研究与发展;2005年02期
4 刘广忠;肖钰;袁淑芳;;基于外部共享Cache的多处理机Cache一致性协议[J];河北工程技术高等专科学校学报;2006年02期
5 吴从晖,徐青,朱彩英,池天河,何建邦,陈荣国;基于软件DSMs网络系统的机载SAR图像并行处理的研究[J];计算机工程与应用;2001年07期
6 章隆兵,章晓良;软件DSM系统中的全局断点技术[J];计算机工程与应用;2002年07期
7 李静梅;杨鹏飞;张健沛;门朝光;吴艳霞;;适用于多核环境的混合Cache一致性协议[J];计算机工程;2011年24期
8 周伟波,戴华东,杨学军;线程一致性模型及其实现[J];计算机工程与科学;2003年01期
9 章隆兵,张福新,吴少刚,陈意云;基于锁集合的动态数据竞争检测方法[J];计算机学报;2003年10期
10 林伟;叶笑春;宋风龙;张浩;;众核处理器中使用写掩码实现混合写回/写穿透策略[J];计算机学报;2008年11期
相关会议论文 前1条
1 乔立民;徐汉川;刘旭东;;利用Monitor解决J2EE Web应用程序的并发问题[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年
相关博士学位论文 前7条
1 戴华东;并行分布操作系统共享存储管理及其优化技术的研究[D];国防科学技术大学;2002年
2 吴少刚;机群系统OpenMP研究[D];中国科学院研究生院(计算技术研究所);2004年
3 潘国腾;CC-NUMA系统存储体系结构关键技术研究[D];国防科学技术大学;2007年
4 王庆;面向嵌入式多核系统的并行程序优化技术研究[D];哈尔滨工业大学;2013年
5 朱素霞;面向多核处理器确定性重演的内存竞争记录机制研究[D];哈尔滨工业大学;2013年
6 冯超超;片上网络无缓冲路由器关键技术研究[D];国防科学技术大学;2012年
7 李建华;片上多核处理器缓存子系统优化的研究[D];中国科学技术大学;2013年
相关硕士学位论文 前10条
1 田新宇;网络存储阵列中CACHE的设计[D];西南交通大学;2011年
2 高晓东;基于多核平台的高速网络数据捕获和并行处理研究与实现[D];哈尔滨工业大学;2010年
3 杨鹏飞;多核环境Cache一致性协议研究[D];哈尔滨工程大学;2011年
4 陈丹丹;用软件实现局域网中的内存共享[D];南京航空航天大学;2002年
5 刘旭民;一种避免伪共享的分布式共享存储协议的设计与实现[D];暨南大学;2003年
6 冯灿;WindowsNT系统下实时动态模拟环境[D];电子科技大学;2006年
7 孙春玲;基于局域网的共享存储研究[D];北京交通大学;2008年
8 刘华;WindowsNT系统下多任务间进程通讯的研究和模拟[D];电子科技大学;2009年
9 何宇磊;虚拟膝关节镜手术交互装置设计及系统研发[D];广东工业大学;2012年
10 付波;基于dsp的两级cache低功耗研究与实现[D];南昌大学;2012年
【相似文献】
相关期刊论文 前10条
1 贲可荣,孙宁;计算机科学中的待解问题综述[J];计算机工程与科学;2005年10期
2 陈海建;胡丽芳;于乐;王焱;;BP神经网络在元器件贮存可靠性参数预测中的应用[J];海军航空工程学院学报;2008年02期
3 覃蓉芳,袁旭;预测模型在计算机中的存取[J];四川有色金属;1995年02期
4 李俊莹;;论“计算机未来学”[J];网络与信息;2008年06期
5 王铮;张毅;;改进的基于目录的Cache一致性协议[J];计算机工程;2009年01期
6 袁爱东,董建萍;基于目录的一致性协议浅析[J];计算机工程;2004年S1期
7 蔡晔;史岗;;基于锁的Cache一致性协议的硬件优化策略[J];高技术通讯;2009年09期
8 胡海波,陈增强,袁著祉;并行广义预测自校正控制器(GPC)[J];系统工程与电子技术;1994年01期
9 庄晓彤,王勤,张克弼;一个基于预测和Client/Server互操作的网络传输模型[J];计算机工程;2000年03期
10 胡_g;柴华;;Cache一致性机制及其相关研究[J];科技情报开发与经济;2008年17期
相关会议论文 前10条
1 尹飞;吴磊;;基于功能覆盖率验证多核处理器中的Cache一致性协议[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年
2 汤克明;王创伟;陈];;P2P模拟器的比较研究[A];2008年全国开放式分布与并行计算机学术会议论文集(上册)[C];2008年
3 吴长俊;曾国荪;刘涛;;异构环境下一种实现负载均衡的MIMO反馈控制模型[A];2006年全国理论计算机科学学术年会论文集[C];2006年
4 莫倩芸;钟诚;;机群系统上并行计算时间序列的动态弯曲距离[A];2008年全国开放式分布与并行计算机学术会议论文集(下册)[C];2008年
5 谈春燕;;计算机集群系统技术探讨[A];第三届全国现代设备管理及应用技术研讨会交流论文集[C];2004年
6 李蒙;王俊;赵敬;武鹏;;基于DSP/FPGA的大容量存储设备[A];全国第十届信号与信息处理、第四届DSP应用技术联合学术会议论文集[C];2006年
7 李琦;高军萍;;一种基于多机通信的存储器扩容方法研究[A];2007'中国仪器仪表与测控技术交流大会论文集(一)[C];2007年
8 朱连章;魏晓慧;;基于着色Petri网避免并发系统死锁的方法[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
9 刘萍;钟诚;;机群系统上基于映射和抽样划分的并行聚类算法[A];2008年全国开放式分布与并行计算机学术会议论文集(上册)[C];2008年
10 陆向艳;钟诚;;机群系统上长序列最大串联重复识别并行算法[A];2010年全国开放式分布与并行计算机学术会议论文集[C];2010年
相关重要报纸文章 前10条
1 中国软件评测中心媒体测试部;设计出众 可扩展性优秀[N];中国计算机报;2009年
2 一冰;万全R150填补联想单路机架式服务器空白[N];电脑商报;2008年
3 Gina Geisel;SAS:新一代SCSI[N];网络世界;2008年
4 ;戴尔用实惠价促HPC普及[N];中国计算机报;2006年
5 方正;以创新突破x64瓶颈[N];网络世界;2006年
6 张承东;戴尔新型存储设备可扩展性提升三倍[N];网络世界;2008年
7 ;海量存储简单化[N];网络世界;2005年
8 郭平;CLARiiON诠释新架构[N];计算机世界;2006年
9 郭松柳 顾瑜 陈建党 汪东升;可扩展的片上多处理器模拟器及评测系统[N];计算机世界;2005年
10 北京捷华润公司 郝常杰;对象存储:块和文件之外的存储形式[N];中国计算机报;2006年
相关博士学位论文 前10条
1 王之元;并行计算可扩展性分析与优化[D];国防科学技术大学;2011年
2 潘国腾;CC-NUMA系统存储体系结构关键技术研究[D];国防科学技术大学;2007年
3 庞征斌;基于SMP的CC-NUMA类大规模系统中Cache一致性协议研究与实现[D];国防科学技术大学;2007年
4 陈军;分布式存储环境下并行计算可扩展性的研究与应用[D];中国人民解放军国防科学技术大学;2000年
5 李功明;片上多处理器体系结构中Cache一致性模型研究[D];中国科学技术大学;2013年
6 曹家鑫;数据中心中的一种可扩展和高效的可靠组数据传输方法[D];中国科学技术大学;2013年
7 李怀阳;进化存储系统数据组织模式研究[D];华中科技大学;2006年
8 刘群;基于可扩展对象的海量存储系统研究[D];华中科技大学;2006年
9 罗益辉;海量对象存储系统数据组织算法的研究[D];华中科技大学;2006年
10 钟海峰;层次p2p存储系统关键技术研究[D];华中科技大学;2011年
相关硕士学位论文 前10条
1 张毅;CC-NUMA多机系统Cache一致性研究[D];重庆大学;2008年
2 贺尔华;可扩展层次式Cache一致性目录方法的研究与实现[D];国防科学技术大学;2004年
3 张腾;数据中心网络可扩展性和多路路由研究[D];清华大学;2012年
4 张泽;多内核cache一致性协议研究与实现[D];西安电子科技大学;2013年
5 周川;众核处理器中动态可重构Cache一致性协议的研究与实现[D];上海交通大学;2013年
6 钟恺文;一种数字信号处理器内核的设计与扩展[D];上海交通大学;2009年
7 孔令鑫;基于异构Beowulf机群的并行计算模型的研究[D];曲阜师范大学;2009年
8 汪焱雷;嵌入式环境下可扩展性图形用户界面的研究与实现[D];华中科技大学;2012年
9 崔磊;数据Cache存储体的设计与验证[D];国防科学技术大学;2006年
10 代明;安全微处理器存储控制单元的研究与设计[D];华北电力大学(北京);2008年
,本文编号:1453159
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1453159.html