片上多核处理器Cache一致性协议优化研究综述
【图文】:
降南∈枘柯?sparsedirectory)结构[65].Hill等人证明,稀疏目录能以较小的面积和更大的灵活性来获得目录的可扩展性[16].粗向量(coarsevector)[66]目录结构,如SparseCOMP-n/4、SparseCOMP-log(n)+1[67]、有限指针(limitedpointer)[67]、Stash目录[68]等存储结构,都是压缩每条目录条目的方法.SparseCOMP-n/4每4个核用1比特位记录共享信息,不能准确跟踪共享信息,导致必须进行进一步的嗅探,降低了性能.SparseCOMP-log(n)+1采用log(n)位编码,用链表记录每一个共享者信息,导致了性能和带宽的开销.图4所示为存储配置为64KB私有L1、256KB私有L2、1MB共享L3的系统中各种目录结构所占片上存储空间的比例(SPACE和SCD目录在后面介绍).Fig.4Fractionofon-chipstorageoccupiedbycoherencedirectory图4各种目录所占片上存储空间小结.采用压缩稀疏目录条目的方法,由于采用了粗粒度的跟踪方法,并不能精确地记录共享信息,还需要采用额外的手段进行共享信息的跟踪.另外,有的压缩方法设定了目录可以跟踪共享节点的上限,在共享节点数量不超过上限时能够进行准确的跟踪,而当共享节点数目超出上限时,则会发生目录溢出.因此,还需要引入冲突解决机制实现目录置换.有限指针技术懫用动态指针分配的链表机制来存储共享者信息,避免了目录溢出情况的发生.在有限指针技术中,头指针占用较大的存储空间,空间利用率不高.另外,共享节点的信息是以链式来组织的,每次访问目录都要顺序遍历链表.尽管有的设计采用了双向链表来实现,但遍历速度的提升仍然十分有限.4.3面向一致性粒度的优化方法一致性粒度从最小的Cache行粒度到区域粒度,再到最大的操作系统页面的粒度,目前都有研究成果发表.共享数据的粒度是多样的[69],但是固定粒度的一致性协议导致了不
降南∈枘柯?sparsedirectory)结构[65].Hill等人证明,稀疏目录能以较小的面积和更大的灵活性来获得目录的可扩展性[16].粗向量(coarsevector)[66]目录结构,如SparseCOMP-n/4、SparseCOMP-log(n)+1[67]、有限指针(limitedpointer)[67]、Stash目录[68]等存储结构,都是压缩每条目录条目的方法.SparseCOMP-n/4每4个核用1比特位记录共享信息,不能准确跟踪共享信息,导致必须进行进一步的嗅探,降低了性能.SparseCOMP-log(n)+1采用log(n)位编码,用链表记录每一个共享者信息,导致了性能和带宽的开销.图4所示为存储配置为64KB私有L1、256KB私有L2、1MB共享L3的系统中各种目录结构所占片上存储空间的比例(SPACE和SCD目录在后面介绍).Fig.4Fractionofon-chipstorageoccupiedbycoherencedirectory图4各种目录所占片上存储空间小结.采用压缩稀疏目录条目的方法,由于采用了粗粒度的跟踪方法,并不能精确地记录共享信息,还需要采用额外的手段进行共享信息的跟踪.另外,有的压缩方法设定了目录可以跟踪共享节点的上限,在共享节点数量不超过上限时能够进行准确的跟踪,而当共享节点数目超出上限时,则会发生目录溢出.因此,还需要引入冲突解决机制实现目录置换.有限指针技术懫用动态指针分配的链表机制来存储共享者信息,避免了目录溢出情况的发生.在有限指针技术中,头指针占用较大的存储空间,空间利用率不高.另外,共享节点的信息是以链式来组织的,每次访问目录都要顺序遍历链表.尽管有的设计采用了双向链表来实现,但遍历速度的提升仍然十分有限.4.3面向一致性粒度的优化方法一致性粒度从最小的Cache行粒度到区域粒度,再到最大的操作系统页面的粒度,目前都有研究成果发表.共享数据的粒度是多样的[69],但是固定粒度的一致性协议导致了不
【参考文献】
相关期刊论文 前6条
1 张骏;田泽;梅魁志;赵季中;;基于节点预测的直接Cache一致性协议[J];计算机学报;2014年03期
2 徐卫志;宋风龙;刘志勇;范东睿;余磊;张帅;;众核处理器片上同步机制和评估方法研究[J];计算机学报;2010年10期
3 包尔固德;李伟生;范东睿;杨扬;马啸宇;;Godson-T众核体系结构上的Broadcast性能优化[J];计算机研究与发展;2010年03期
4 郭松柳;王海霞;薛一波;李崇民;汪东升;;Hierarchical Cache Directory for CMP[J];Journal of Computer Science & Technology;2010年02期
5 范东睿;袁楠;张军超;周永彬;林伟;宋风龙;叶笑春;黄河;余磊;龙国平;张浩;刘磊;;Godson-T:An Efficient Many-Core Architecture for Parallel Program Executions[J];Journal of Computer Science & Technology;2009年06期
6 黄河;刘磊;宋风龙;马啸宇;;硬件结构支持的基于同步的高速缓存一致性协议[J];计算机学报;2009年08期
相关博士学位论文 前1条
1 李功明;片上多处理器体系结构中Cache一致性模型研究[D];中国科学技术大学;2013年
【共引文献】
相关期刊论文 前10条
1 潘旭明;刘嵩岩;齐可心;吴尚儒;陈婷;;基于NAND Flash的存储设备设计与实现[J];无线电通信技术;2017年04期
2 陈继承;李一韩;赵雅倩;王恩东;史宏志;唐士斌;;一种基于共享转发态的多级缓存一致性协议[J];计算机研究与发展;2017年04期
3 陈继承;赵雅倩;李一韩;王恩东;史宏志;唐士斌;;MPD:结点具有多个并行缓存一致性域的CC-NUMA系统[J];计算机研究与发展;2017年04期
4 陈小莉;;基于大数据的计算机数据挖掘技术在档案管理系统中的研究应用[J];激光杂志;2017年02期
5 何王全;刘勇;方燕飞;魏迪;漆锋滨;;面向国产异构众核系统的Parallel C语言设计与实现[J];软件学报;2017年04期
6 杜丽娜;韩俊刚;李卯良;;ARM并行阵列机中的路由器设计[J];微电子学与计算机;2017年02期
7 胡森森;计卫星;王一拙;陈旭;付文飞;石峰;;片上多核处理器Cache一致性协议优化研究综述[J];软件学报;2017年04期
8 尤冬石;刘亚龙;殷若鹏;;基于定量递归分析的天然气管线输送流量均衡调度方法[J];智能计算机与应用;2016年04期
9 冯晓;戴紫彬;李伟;蔡路亭;;基于Amdahl定律的多核密码处理器性能模型研究[J];电子与信息学报;2016年04期
10 石嵩;宁永波;李宏亮;郑方;;阵列众核结构上的一种多层分区Hash连接算法[J];计算机科学;2016年03期
相关博士学位论文 前1条
1 孙荪;提高多核处理器片上Cache利用率的关键技术研究[D];中国科学技术大学;2015年
【二级参考文献】
相关期刊论文 前5条
1 黄安文;张民选;;多核处理器Cache一致性协议关键技术研究[J];计算机工程与科学;2009年S1期
2 王钰;;多机可缩放性高速缓冲存储器一致性协议分析[J];计算机技术与发展;2009年02期
3 曹政;王达伟;刘新春;孙凝晖;;曙光5000高性能计算机Barrier网络的设计[J];计算机学报;2008年10期
4 黄琨;马可;曾洪博;张戈;章隆兵;;一种分片式多核处理器的用户级模拟器[J];软件学报;2008年04期
5 胡伟武,施巍松,唐志敏;基于新型Cache一致性协议的共享虚拟存储系统[J];计算机学报;1999年05期
【相似文献】
相关期刊论文 前10条
1 张洋;;虞志益:引领多核处理器创新之路[J];中国发明与专利;2013年01期
2 羽路;;多核处理器悄然崛起[J];集成电路应用;2005年05期
3 ;多核处理器强调多任务并行处理[J];每周电脑报;2006年35期
4 冯磊;;多核处理器的数量裸奔[J];信息系统工程;2006年11期
5 张浩;兰峰;;多核处理器基本原理及其在汽车领域中应用的展望[J];汽车科技;2007年03期
6 何军;王飙;;多核处理器的结构设计研究[J];计算机工程;2007年16期
7 肖红;;基于多核处理器系统开发中的几个问题[J];广东广播电视大学学报;2007年04期
8 张健浪;;三大于二,多核CPU之田忌赛马[J];新电脑;2008年06期
9 都思丹;;前言:嵌入式多核处理器系统及视频信号处理技术研究进展[J];南京大学学报(自然科学版);2009年01期
10 黄国睿;张平;魏广博;;多核处理器的关键技术及其发展趋势[J];计算机工程与设计;2009年10期
相关会议论文 前10条
1 郭建军;戴葵;王志英;;一种多核处理器存储层次性能评估模型[A];第八届全国信息隐藏与多媒体安全学术大会湖南省计算机学会第十一届学术年会论文集[C];2009年
2 彭林;张小强;刘德峰;谢伦国;田祖伟;;一种挖掘多核处理器存储级并行的算法[A];第15届全国信息存储技术学术会议论文集[C];2008年
3 刘杰;马彦;叶维;高剑刚;;多核处理器存储体系分析[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年
4 潘送军;胡瑜;李晓维;;多核处理器瞬态故障敏感性分析[A];第五届中国测试学术会议论文集[C];2008年
5 万志涛;章恒;张若渊;;基于多核处理器的深度包检测的实现和性能评估[A];中国通信学会信息通信网络技术委员会2009年年会论文集(上册)[C];2009年
6 方娟;张红波;;多核处理器预取策略的研究[A];2010年全国开放式分布与并行计算机学术会议论文集[C];2010年
7 何军;王飙;;通用多核处理器发展现状和趋势研究[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年
8 桂亚东;;高效能计算机技术展望[A];庆祝中国力学学会成立50周年暨中国力学学会学术大会’2007论文摘要集(下)[C];2007年
9 万志涛;;基于多核处理器的面向时延敏感服务的云基础架构[A];中国通信学会信息通信网络技术委员会2011年年会论文集(上册)[C];2011年
10 陈远知;;多核处理器的里程碑——TILE64[A];全国第三届信号和智能信息处理与应用学术交流会专刊[C];2009年
相关重要报纸文章 前10条
1 记者 曹继军 颜维琦;我国多核处理器研究实现新突破[N];光明日报;2012年
2 庆广;多核处理器助力无线多媒体业务拓展[N];中国电子报;2009年
3 北京大学计算语言所副所长 詹卫东;多核服务器:计算优势更上层楼[N];计算机世界;2005年
4 北京大学计算语言所副所长 詹卫东;双/多核服务器 计算优势更上层楼[N];网络世界;2005年
5 江南计算技术研究所 何正未;软件滞后制约多核应用[N];计算机世界;2006年
6 李梅 编译;多核处理器新年井喷[N];计算机世界;2007年
7 英特尔产品与平台市场部门数字家庭市场经理 庄淳杰;多核将大行其道[N];计算机世界;2007年
8 本报记者 陈斌;多核处理器的未来路径[N];计算机世界;2008年
9 王悦承;Oracle改变多核定价模式[N];中国计算机报;2006年
10 ;多核:技术无悬念应用待拓展[N];计算机世界;2008年
相关博士学位论文 前10条
1 柴松;片上多核处理器的调度算法研究[D];电子科技大学;2014年
2 付桂涛;面向多核处理器的令牌一致性协议优化技术研究[D];国防科学技术大学;2014年
3 易娟;面向多核处理器系统的可靠性与能耗优化调度研究[D];重庆大学;2016年
4 王淼;面向多核处理器的并行编译及优化关键技术研究[D];国防科学技术大学;2010年
5 魏海涛;面向多核处理器的数据流程序编译关键技术研究[D];华中科技大学;2010年
6 吕海;多核处理器芯片计算平台中并行程序性能优化的研究[D];北京工业大学;2012年
7 李建华;片上多核处理器缓存子系统优化的研究[D];中国科学技术大学;2013年
8 杜建军;共享高速缓存多核处理器的关键技术研究[D];重庆大学;2011年
9 陈锐忠;非对称多核处理器的若干调度问题研究[D];华南理工大学;2013年
10 邓林;单芯片多核处理器存储优化技术研究[D];国防科学技术大学;2011年
相关硕士学位论文 前10条
1 秦培斌;基于多核路由器的加密卡驱动系统设计与实现[D];西南交通大学;2015年
2 张请;多核处理器关键技术研究[D];复旦大学;2014年
3 陈帅军;基于国产多核处理器核级冗余静态绑定和动态绑定机制的研究[D];哈尔滨工业大学;2015年
4 罗成;基于多核处理器的高速数码印花机数据传输处理系统硬件设计[D];浙江大学;2015年
5 宦维祥;基于众核的多租户网络出访问控制的研究[D];复旦大学;2013年
6 杨杭军;基于多核处理器的视频编解码并行算法研究[D];南京大学;2013年
7 吴熙;JPEG压缩编码在嵌入式多核处理器上的优化技术研究[D];武汉纺织大学;2015年
8 王宗炎;基于OVP的多核处理器系统级建模与评估[D];复旦大学;2014年
9 范少华;多核处理器映射关键技术研究[D];复旦大学;2014年
10 裘凯;多核处理器映射关键技术研究[D];复旦大学;2014年
,本文编号:2694461
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2694461.html