当前位置:主页 > 科技论文 > 计算机论文 >

面向高性能计算的众核处理器结构级高能效技术

发布时间:2018-04-14 09:36

  本文选题:众核处理器 + 结构优化 ; 参考:《计算机学报》2014年10期


【摘要】:随着半导体技术的进步,众核处理器已经广泛应用于高性能计算领域.而要构建未来高性能计算系统,处理器必须突破严峻的"能耗墙"挑战.文中以一款自主众核处理器DFMC原型为基础,首先对其在典型负载下的能耗分布进行了分析,结合该处理器的具体结构,提出了基于指令窗口的指令缓冲、操作数锁存两种结构级能效优化技术,探索了能效优先的浮点部件设计方法.实验表明,通过上述技术可以降低处理器取指和译码能耗约50%、寄存器文件能耗11.2%和浮点部件能耗17.6%,最终全芯片降低能耗约14.7%.在该文所述实验环境下,作者还进行了DFMC原型的双精度矩阵乘(DGEMM)性能功耗比测试,并与NVIDIA公司的Kepler K20GPU进行了对比.
[Abstract]:With the progress of semiconductor technology, multicore processors have been widely used in the field of high performance computing.In order to build high performance computing system in the future, the processor must break through the challenge of energy consumption wall.Based on the prototype of an autonomous multi-core processor (DFMC), the distribution of energy consumption under typical load is analyzed, and the instruction buffering based on instruction window is proposed according to the specific structure of the processor.The design method of floating-point parts with priority of energy efficiency is explored by two kinds of structure level energy efficiency optimization techniques of Operand latch.The experimental results show that the energy consumption of the processor can be reduced by 50%, the energy consumption of register files by 11.2% and the energy consumption of floating-point parts by 17.6%. Finally, the energy consumption of the whole chip can be reduced by about 14.775%.In the experimental environment described in this paper, the performance power ratio of DFMC prototype by double precision matrix multiplication (DGEMMMMM) is also tested and compared with that of Kepler K20GPU of NVIDIA Company.
【作者单位】: 数学工程与先进计算国家重点实验室;国家并行计算机工程技术研究中心;
【基金】:国家“八六三”高技术研究发展计划重大项目基金(2014AA01A300) 国家“核高基”重大专项(2013ZX0102-8001-001-001)资助
【分类号】:TP332

【相似文献】

相关期刊论文 前10条

1 谢茗涛;高性能计算顶级会议在京 IBM论道“深度计算”[J];计算机与网络;2000年10期

2 陈晓鹏;中国高性能计算冲击新高标[J];中国计算机用户;2003年29期

3 边锋;;HPC的未来在“用好”[J];中国计算机用户;2009年14期

4 马一丁;;性能和功耗无需折衷的高性能新型多核DSP[J];中国电子商情(基础电子);2009年12期

5 周晓娟;;对话中山大学网络与信息技术中心主任郭清顺:高性能计算进入良性循环[J];中国教育网络;2010年09期

6 边凯;用NAS寻找沙漠中的黑金[J];中国计算机用户;2005年04期

7 李刚;;高性能计算源于惠普“动能”[J];软件世界;2007年18期

8 覃小旅;普及高性能计算知识的一种途径[J];广西民族学院学报(自然科学版);1999年03期

9 ;康柏让高性能计算永不停顿[J];信息系统工程;2000年10期

10 边凯;石菲;郑悦;董丽凤;;好用才是硬道理[J];中国计算机用户;2007年09期

相关会议论文 前10条

1 王勇;;应急管理与高性能计算(节选)[A];“广东科协论坛第27期:高性能计算与技术创新”荟萃[C];2009年

2 李根国;吴建成;;高性能计算在工业工程领域的应用和发展[A];庆祝中国力学学会成立50周年暨中国力学学会学术大会’2007论文摘要集(下)[C];2007年

3 顾国平;周隽;;基于IBM的高性能计算平台解决方案[A];首届工程设计高性能计算(HPC)技术应用论坛论文集[C];2007年

4 王爱英;张倩芸;;基于GPU的高性能计算及在矩阵运算中的应用[A];第十三届全国信号处理学术年会(CCSP-2007)论文集[C];2007年

5 卢宇彤;杨学军;;面向分布对象存储结构的高性能计算系统资源管理方法[A];第15届全国信息存储技术学术会议论文集[C];2008年

6 耕耘;;“广东科协论坛第27期:高性能计算与技术创新”取得丰硕的成果[A];“广东科协论坛第27期:高性能计算与技术创新”荟萃[C];2009年

7 朱平;朱建涛;高剑刚;蒋金虎;;高性能计算存储关键技术研究[A];2010年第16届全国信息存储技术大会(IST2010)论文集[C];2010年

8 汪澍;;Cisco高性能网络计算可普及的超级计算机[A];从远程终端到网格计算研讨会论文集[C];2006年

9 金钟;魏帆;张宝花;刘倩;;面向高性能计算化学的专业计算社区[A];中国化学会第28届学术年会第13分会场摘要集[C];2012年

10 ;新一代工作站专业显卡NVIDIA Quadro FX系列零距离接触[A];工程三维模型与虚拟现实表现——第二届工程建设计算机应用创新论坛论文集[C];2009年

相关重要报纸文章 前10条

1 祁金华;国产高性能计算 在应用中前行[N];网络世界;2007年

2 郑燃;牵手曙光 微软试水高性能计算[N];政府采购信息报;2007年

3 凡妮;IBM BladeCenter QS22将高性能计算带到实验室之外[N];电脑商报;2008年

4 清水;Windows入侵高性能计算[N];计算机世界;2004年

5 本报记者 汤铭;高性能计算应用提速[N];计算机世界;2008年

6 本报记者 刘洪宇;高性能计算:保障石油高产稳产的技术尖兵[N];中国计算机报;2010年

7 佟乐;NAS也要实现高性能[N];网络世界;2007年

8 郭平;HDS增强高性能NAS平台[N];计算机世界;2007年

9 汪东升;聚焦高性能计算[N];计算机世界;2001年

10 记者 孙永杰;高性能计算升温 应用亟待拓展[N];中国电子报;2007年

相关博士学位论文 前10条

1 杜云飞;容错并行算法的研究与分析[D];国防科学技术大学;2008年

2 罗飞;具有数据依赖的对等高性能计算关键技术研究[D];华中科技大学;2008年

3 李琼;面向高性能计算的可扩展I/O体系结构研究与实现[D];国防科学技术大学;2009年

4 唐源;嵌入虚拟机监视器的高性能覆盖网络研究[D];电子科技大学;2012年

5 陈永然;面向高性能计算的性能评价模型技术研究[D];国防科学技术大学;2007年

6 张波涛;片上高性能嵌入式计算—面向软基带的应用并行处理模型及体系结构[D];国防科学技术大学;2011年

7 吴丹;高效能计算型存储器体系结构关键技术研究与实现[D];华中科技大学;2012年

8 白洪涛;基于GPU的高性能并行算法研究[D];吉林大学;2010年

9 洪兴勇;高性能BWDSP处理器指令Cache研究与设计[D];合肥工业大学;2013年

10 曾碧卿;分布式计算中并行I/O调度策略研究[D];中南大学;2005年

相关硕士学位论文 前10条

1 金毅;基于案例-任务驱动教学法的高性能计算课程研究[D];新疆师范大学;2010年

2 王钦;理论化学高性能计算集群的组建与应用研究[D];吉林大学;2011年

3 李卓;高性能计算在理论化学计算中的应用[D];吉林大学;2011年

4 张挺;基于粒子模拟问题的GPU高性能计算系统[D];复旦大学;2010年

5 高一峰;中国高性能计算领域市场分析及营销策略研究[D];北京交通大学;2007年

6 李程远;高性能PC集群的研究与应用[D];浙江大学;2004年

7 李初辉;高性能计算系统内存子系统的性能预测模型研究[D];复旦大学;2008年

8 李勇;适用于高性能计算的虚拟机计算资源管理系统[D];华中科技大学;2008年

9 王勇超;高性能计算集群技术应用研究[D];西安理工大学;2007年

10 林中一;容错不死系统的研究与实现[D];浙江大学;2006年



本文编号:1748768

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1748768.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户326ff***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com