MACT:高通量众核处理器离散访存请求批量处理机制
本文选题:高通量处理器 切入点:访存请求收集表 出处:《计算机研究与发展》2015年06期
【摘要】:网络服务等新型高通量应用的迅速兴起给传统处理器设计带来了巨大的挑战.高通量众核处理器作为面向此类应用的新型处理器结构成为研究热点.然而,随着片上处理核数量的剧增,加之高通量应用的数据密集型特点,"存储墙"问题进一步加剧.通过分析高通量应用访存行为,发现此类应用存在着大量的细粒度访存,降低了访存带宽的有效利用率.基于此分析,在高通量处理器设计中通过添加访存请求收集表(memory access collection table,MACT)硬件机制,结合消息式内存机制,用于收集离散的访存请求并进行批量处理.MACT硬件机制的实现,提高了访存带宽的有效利用率,同时也提高了执行效率;并通过时间窗口机制,确保访存请求在最晚期限之前发送出去,保证任务的实时性.实验以典型高通量应用WordCount,TeraSort,Search为基准测试程序.添加MACT硬件机制后,访存数量减少约49%,访存带宽提高约24%,平均执行速度提高约89%.
[Abstract]:The rapid rise of new high-throughput applications such as network services brings great challenges to the traditional processor design.As a new processor architecture for such applications, high throughput multicore processor has become a research hotspot.However, with the rapid increase in the number of cores processed on a chip and the data-intensive characteristics of high-throughput applications, the "storage wall" problem is exacerbated.By analyzing the memory access behavior of high-throughput applications, it is found that there are a large number of fine-grained memory access in such applications, which reduces the effective utilization of access bandwidth.Based on this analysis, the memory access collection table MACT-based hardware mechanism is added to the design of high throughput processor, and combined with the message memory mechanism, it is used to collect discrete memory requests and implement the batch processing of .MACT hardware mechanism.The efficiency of accessing bandwidth is improved, and the execution efficiency is improved, and the time window mechanism is used to ensure that the access request is sent out before the latest deadline to ensure the real-time performance of the task.The experiment is based on the typical high throughput application of WordCountl Tera sort search as a benchmark program.After adding the MACT hardware mechanism, the number of access memory is reduced by 49%, the access bandwidth is increased about 24%, and the average execution speed is increased about 89%.
【作者单位】: 计算机体系结构国家重点实验室(中国科学院计算技术研究所);中国科学院大学计算机与控制学院;数学工程与先进计算国家重点实验室;中国科学技术大学计算机科学与技术学院;
【基金】:国家“九七三”重点基础研究发展计划基金项目(2011CB302501) 国家“八六三”高技术研究发展计划基金项目(2012AA010901,2015AA011204) “核高基”国家科技重大专项基金项目(2013ZX0102-8001-001-001) 国家自然科学基金项目(61173007,61332009,61204047)
【分类号】:TP332
【参考文献】
相关期刊论文 前2条
1 王元卓;靳小龙;程学旗;;网络大数据:现状与展望[J];计算机学报;2013年06期
2 陈荔城;陈明宇;阮元;黄永兵;崔泽汉;卢天越;包云岗;;MIMS:Towards a Message Interface Based Memory System[J];Journal of Computer Science & Technology;2014年02期
【共引文献】
相关期刊论文 前10条
1 郎波;张博宇;;面向大数据的非结构化数据管理平台关键技术[J];信息技术与标准化;2013年10期
2 邵景峰;崔尊民;王进富;白晓波;;大数据下纺织制造执行系统的构建[J];纺织器材;2013年06期
3 张亚楠;谭跃生;;基于MapReduce的并行遮盖文本聚类算法[J];内蒙古科技大学学报;2013年03期
4 周国亮;朱永利;王桂兰;;CC-MRSJ:Hadoop平台下缓存敏感的星型联接算法[J];电信科学;2013年10期
5 刘琼;;大数据背景下图书馆服务体系创新与重构[J];科技创新与应用;2014年06期
6 王鹏;黄焱;刘峰;安俊秀;;大数据技术中计算与数据的协作机制[J];成都信息工程学院学报;2014年01期
7 杜政颉;王鹏;黄焱;郎福通;;一种基于Storm编程模型的迭代Topology方案[J];成都信息工程学院学报;2014年01期
8 范飞;黄文明;邓珍荣;;Oozie工作流在Mahout分布式数据挖掘中的应用[J];桂林电子科技大学学报;2014年01期
9 陈为;李健;胡康;;食品药品检验行业大数据应用探讨[J];中国医药导刊;2014年02期
10 丁玉成;诸葛晴凤;沙行勉;;云计算环境下排序算法的性能分析[J];重庆大学学报;2014年04期
相关会议论文 前6条
1 乔媛媛;刘芳;凌艳;尹劲松;;云计算环境下MapReduce的资源建模与性能预测[A];2013年全国通信软件学术会议论文集[C];2013年
2 Xiaoguang Han;Jigang Sun;Wu Qu;Xuanxia Yao;;Distributed Malware Detection based on Binary File Features in Cloud Computing Environment[A];第26届中国控制与决策会议论文集[C];2014年
3 陈佐旗;余柏蒗;吴健平;;基于GPU通用计算的遥感数据处理——以计算地表太阳辐射值为例[A];第十八届中国环境遥感应用技术论坛论文集[C];2014年
4 白永超;付伟;辛阳;;基于Hadoop和Nutch的分布式搜索引擎研究与仿真[A];第十九届全国青年通信学术年会论文集[C];2014年
5 李超越;徐国胜;;Hadoop公平调度算法的改进[A];第十九届全国青年通信学术年会论文集[C];2014年
6 高露雄;肖志远;王立海;;基于大数据环境的水文GIS应用发展初探[A];大数据时代的信息化建设——2015(第三届)中国水利信息化与数字水利技术论坛论文集[C];2015年
相关博士学位论文 前10条
1 李健;云计算环境下最小化运营开销的调度技术研究[D];北京邮电大学;2013年
2 王金宝;云计算系统中索引与查询处理技术研究[D];哈尔滨工业大学;2013年
3 韩晶;大数据服务若干关键技术研究[D];北京邮电大学;2013年
4 程祥;高效可靠的虚拟网络映射技术研究[D];北京邮电大学;2013年
5 李韧;基于Hadoop的大规模语义Web本体数据查询与推理关键技术研究[D];重庆大学;2013年
6 卢风顺;面向CPU/GPU异构体系结构的并行计算关键技术研究[D];国防科学技术大学;2012年
7 孙鹏;动车组维修物联网及其关键技术研究[D];中国铁道科学研究院;2013年
8 肖奎;维基百科大数据的知识挖掘与管理方法研究[D];武汉大学;2013年
9 程兴国;仿生算法的动态反馈机制及其并行化实现方法研究[D];华南理工大学;2013年
10 李清安;面向非易失性片上存储的编译技术研究[D];武汉大学;2013年
相关硕士学位论文 前10条
1 陈贞;HDFS环境下的访问控制技术研究[D];重庆大学;2013年
2 张丹;HDFS中文件存储优化的相关技术研究[D];南京师范大学;2013年
3 潘吴斌;基于云计算的并行K-means气象数据挖掘研究与应用[D];南京信息工程大学;2013年
4 赵洪昌;云计算下的关联分析和模糊聚类研究[D];南京信息工程大学;2013年
5 汪洋;通信网云计算平台资源调度策略与算法研究[D];南昌大学;2013年
6 吕天然;基于MapReduce的可视化工作流遥感并行处理平台及关键技术研究[D];河南大学;2013年
7 但光祥;云计算环境下混合加密算法研究与实现[D];重庆大学;2013年
8 周涛;基于Hadoop的遥感数字图像处理方法研究[D];东北师范大学;2013年
9 程伟;海量信令并行即时分析系统的研究与设计[D];中国海洋大学;2013年
10 贾玉辉;面向语音交互的云计算系统的研究[D];中国海洋大学;2013年
【二级参考文献】
相关期刊论文 前7条
1 周傲英;金澈清;王国仁;李建中;;不确定性数据管理技术研究综述[J];计算机学报;2009年01期
2 高明;金澈清;王晓玲;田秀霞;周傲英;;数据世系管理技术研究综述[J];计算机学报;2010年03期
3 程学旗;郭嘉丰;靳小龙;;网络信息的检索与挖掘回顾[J];中文信息学报;2011年06期
4 宫学庆;金澈清;王晓玲;张蓉;周傲英;;数据密集型科学与工程:需求和挑战[J];计算机学报;2012年08期
5 李国杰;程学旗;;大数据研究:未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考[J];中国科学院院刊;2012年06期
6 郭志懋,周傲英;数据质量和数据清洗研究综述[J];软件学报;2002年11期
7 刘伟;孟小峰;凌妍妍;;一种基于图模型的Web数据库采样方法[J];软件学报;2008年02期
【相似文献】
相关期刊论文 前10条
1 Robert Cravotta;;可配置处理器应用日趋红火[J];电子设计技术;2003年11期
2 刘磊;邹候文;唐屹;;一种可编程安全处理器体系结构的研究与实现[J];广州大学学报(自然科学版);2006年04期
3 张铮;赵荣彩;颜峻;邰铭;陈科;;网络处理器体系结构和应用综述[J];信息工程大学学报;2006年04期
4 张怡,孙志刚;基于IPSec的下一代高性能安全处理器的体系结构[J];国防科技大学学报;2003年02期
5 岳虹;戴葵;王志英;;一种面向数字信号处理的嵌入式处理器体系结构设计[J];计算机工程与科学;2006年10期
6 许珊琳;;适合嵌入应用的嵌入式处理器[J];中国集成电路;2009年02期
7 张磊;王颖;陈云霁;徐志伟;张立新;;可重塑处理器:用户可定义的加速器中处理器架构[J];网络新媒体技术;2012年06期
8 Robert Cravotta;;一个处理器能兼顾控制与信号处理吗?[J];电子设计技术;2002年07期
9 朱丹;李暾;郭阳;李思昆;;微处理器体系结构级测试程序自动生成技术[J];软件学报;2005年12期
10 ;高性能处理器云集市场[J];每周电脑报;1997年15期
相关会议论文 前3条
1 宋绯;刘晓宁;;DSP/MCU结构的新型处理器[A];第九届全国青年通信学术会议论文集[C];2004年
2 赵秋平;杨灿群;王锋;;LBM算法在Cell处理器上的实现和优化[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
3 周巍;孙冰;战立明;吕建华;王国仁;于戈;;基于DOM模型的XML查询处理器的设计与实现[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
相关重要报纸文章 前10条
1 ;处理器上演多核大戏[N];计算机世界;2005年
2 心元;PC“心脏”的搏击[N];计算机世界;2004年
3 清华大学微处理器与SoC技 术研究中心 王海霞 汪东升;颠覆传统理念[N];计算机世界;2005年
4 清华大学微处理器与SoC技术研究 中心 汪东升 王海霞 张悠慧 李兆麟;CMP 开启处理器效能时代[N];计算机世界;2005年
5 江苏 netfan;体现速度与性能[N];电脑报;2004年
6 四川 王毅;变革进行时[N];电脑报;2004年
7 清华大学微处理器与SoC技术研究中心 汪东升;多核技术天地广阔[N];计算机世界;2006年
8 本报记者 李献 王皓;2002年服务器四大景观[N];计算机世界;2003年
9 ;MontaVista Linux 2.1跨平台[N];中国计算机报;2002年
10 ;CPU技术进步牛气冲天[N];计算机世界;2004年
相关博士学位论文 前10条
1 魏继增;可配置可扩展处理器关键问题研究[D];天津大学;2010年
2 霍文捷;嵌入式处理器安全运行机制的研究与设计[D];华中科技大学;2010年
3 从明;类数据流驱动的分片式处理器体系结构[D];中国科学技术大学;2009年
4 徐光;分片式流处理器体系结构[D];中国科学技术大学;2010年
5 李勇;异步数据触发微处理器体系结构关键技术研究与实现[D];国防科学技术大学;2007年
6 任永青;逻辑核动态可重构的众核处理器体系结构[D];中国科学技术大学;2010年
7 黎铁军;嵌入式流媒体处理器体系结构技术研究[D];国防科学技术大学;2005年
8 黄海林;高可靠处理器体系结构研究[D];中国科学院研究生院(计算技术研究所);2006年
9 刘光辉;高效处理器容错技术研究与实现[D];国防科学技术大学;2013年
10 温璞;面向科学计算的PIM体系结构技术研究[D];国防科学技术大学;2007年
相关硕士学位论文 前10条
1 曾斌;分片式处理器体系结构上的超块优化技术[D];中国科学技术大学;2009年
2 黄冕;X处理器存储一致性模型的研究与实现[D];国防科学技术大学;2008年
3 赵灿明;分片式处理器上激进执行模型分析[D];中国科学技术大学;2009年
4 刘晋汾;处理器描述语言的研究与应用[D];解放军信息工程大学;2011年
5 刘子扬;基于虚拟计算群的众核处理器动态在线任务调度算法研究[D];上海交通大学;2013年
6 邸志雄;多核包处理器数据控制总线技术研究[D];西安电子科技大学;2010年
7 方红霞;基于指令的处理器时延测试产生方法[D];中国科学院研究生院(计算技术研究所);2005年
8 黎宝峰;嵌入式DSP处理器的设计与验证[D];湖南大学;2003年
9 钟松延;可配置可扩展处理器编译器设计[D];天津大学;2012年
10 董亚卓;循环阵列处理器体系结构的关键技术研究与实现[D];国防科学技术大学;2004年
,本文编号:1712107
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1712107.html