当前位置:主页 > 科技论文 > 计算机论文 >

低功耗技术研究—体系结构和编译优化

发布时间:2020-05-15 16:52
【摘要】: 计算机系统的功耗问题是计算机技术进一步发展亟待解决的问题之一。功耗急剧增长提高了芯片的封装和制冷成本。高温环境下执行增加了芯片的失效率,导致计算机系统的可靠性下降。 嵌入式移动计算技术是芯片行业最活跃的领域,嵌入式的移动设备往往依靠电池供电,电池的供电时间是系统的重要参数之一。与半导体技术的发展速度相比电池技术的发展缓慢,未来的移动设备必须在有限能量供应下发挥更大的效能,对系统能量消耗有很高的要求。 信息行业的设备消耗了大量能量,并且能量消耗呈现逐年增长的趋势。大量的能量消耗要求系统采用有效的能量管理策略提高能量的使用效率。因此,不管是嵌入式移动设备还是高性能系统,都必须考虑功耗问题。 从底层的电路技术,到逻辑技术、体系结构技术和高层的软件技术,出现了各种方法用于降低计算机系统的能量消耗。本文重点研究用体系结构设计和编译器指导的方法减少计算机系统的能量消耗。体系结构是软件和硬件的接口,对于低层的低功耗硬件设计和上层的软件低功耗优化都有重要的影响,本文分析了传统体系结构的能量效率变化趋势,提出今后的体系结构低功耗设计的思路之一是采用并行处理技术。当前新的硬件技术—动态电压调节(DVS)和部件动态关闭(TOSU)—为软件低功耗优化提供了手段,本文的工作基于编译器的静态分析或者profile技术,获得应用对系统资源的使用特性,使用DVS或者TOSU技术减少计算机系统的能量消耗。具体说来,本文包括三部分的研究工作:首先研究了微处理器体系结构的能量有效性;然后研究了实时系统的能量有效性优化方法;最后研究了并行系统的能量有效性优化方法。本文的主要创新如下: 1、提出了微处理器的体系结构能量有效性模型,克服了传统的能量有效性模型受工艺参数和电压参数影响的问题,该模型能有效地评估体系结构设计对能量有效性的影响。通过对典型微处理器的分析,验证了该模型的合理性。通过该模型分析了体系结构设计的多种典型技术,得出了并行处理技术和部件使用局部化是提高能量有效性的主要方法。指导了本课题的研究。 2、提出了面向程序的剩余最差时间分析方法,克服了过去动态电压调节技术的研究结果不能紧密结合时间估计技术的问题,给出了动态电压调节算法实现的总体框架,建立了性能/功耗模拟环境RTLPower,嵌入式程序集的测试证明该算法最大能够节省50%的能量。 3、提出了等比例电压调节点的优化放置方法—OPOT和OPTO,OPOT给出了无开销情况下的最优调节点放置方法,并给出了证明,OPTO给出了存在开销情况下的调节点优化放置方法,嵌入式程序集的测试证明两种调节点优化放置方法有效的减少了能量消耗。 4、提出了确定执行模式的最优频率设置指导的贪婪电压调节方法和最高频率限制情况下确定执行模式的最优频率设置指导的贪婪电压调节方法,克服了过去电压调节方法不能有效利用松弛时间的问题,能够最佳地设置每阶段的频率,模拟实验结果验证了两种电压调节方法的有效性。 5、提出了编译器指导的DVS并行系统的能量和性能权衡技术,针对MPI消息传递应用使用编译器自动构造通信和计算区域,为这些区域分配最优的电压/频率,克服了过去的研究完全采用手工方法的问题,建立了性能/功耗的并行模拟环境MIPSpar,并行MPI程序集的测试证明该技术在性能损失不超过5%的情况下,能够节省20~40%的能量消耗。 6、提出了编译器指导的并行系统通信链路的动态关闭技术,编译器将并行程序划分为通信区间和计算区间,使用链路打开/关闭指令动态改变通信链路的状态,克服了基于网络链路利用率的预测方式不可避免地引入的链路打开/关闭开销,模拟实验结果表明在小于1%的网络延迟和性能损失下,减少了20~70%的互连网络能量消耗。
【图文】:

能量消耗,比率,并行执行


ftf 33.2)、(3.4)和(3.5),并行执行时系统的能量消耗2222fVtnC( f/n)(f/n)tE/nppeff = β =并行执行的供电电压,假定单个节点的有效切换电容相,,并行执行的能量消耗是原来的 1/n2,这极大地减少能量效率。近似能量消耗比率为:21/n近似公式(3.4),更精确的能量消耗比率为:22V/Vp=8μm 工艺下,系统频率为 0.5GHz,执行电压为 2V,量消耗比率见图 3.1。

曲线,加速比,曲线


聚合通信的第二项一般占统治地位,也就是说通信时间以系统大小的 log2递增。节点数目的扩展一般不会改变单个节点上通信函数的调用次数。例如在气象模拟程序中,计算发生在规则的网格上,通信发生在网格的边界,每个节点的通信次数是不变的。因此,这里简单的假定应用的通信函数调用次数不变。根据上面的分析,下面给出了 n 个节点的 C 区间执行时间 Rn/c的变化规律,分为以下三种情况: = log,(3)2/,(2),(1)2/22/2//RncaseRncaseRcaseRcccnc聚合通信点对点通信,低起动开销点对点通信,高起动开销(3.12)于是在 n 个节点上的执行时间可以表示为:R = Rs+ Rp/n + Rn/c(3.13)类似 Amdahl 定律,加速比函数为:speedup = 1/R (3.14)
【学位授予单位】:国防科学技术大学
【学位级别】:博士
【学位授予年份】:2006
【分类号】:TP368.1

【引证文献】

相关期刊论文 前1条

1 任静;唐遇星;徐炜遐;;深亚微米工艺下片上存储结构的体系结构级功耗模型[J];计算机研究与发展;2012年S1期

相关会议论文 前1条

1 张峰;陈继承;胡雷钧;;一种基于模糊控制的动态电压调节算法研究与实现[A];第十六届计算机工程与工艺年会暨第二届微处理器技术论坛论文集[C];2012年

相关博士学位论文 前6条

1 富弘毅;OpenMP并行程序容错技术研究[D];国防科学技术大学;2010年

2 贾佳;异构并行计算机容错技术研究[D];国防科学技术大学;2011年

3 王桂彬;大规模异构并行系统软件低功耗优化关键技术研究[D];国防科学技术大学;2011年

4 陈娟;低功耗软件优化技术研究[D];国防科学技术大学;2007年

5 杜云飞;容错并行算法的研究与分析[D];国防科学技术大学;2008年

6 王攀峰;应用级checkpointing技术的研究与实现[D];国防科学技术大学;2008年

相关硕士学位论文 前5条

1 苏博;低功耗数据触发微处理器功能单元的设计与实现[D];国防科学技术大学;2010年

2 任静;深亚微米工艺下微处理器体系结构级功耗模型相关技术研究[D];国防科学技术大学;2011年

3 冀翔宇;低功耗工业无线传感器网络研究与开发[D];浙江大学;2008年

4 刘霞;软实时嵌入式多核处理器系统的低功耗技术研究[D];山东大学;2008年

5 孙少杰;手机低功耗的快速调试技术[D];上海交通大学;2012年



本文编号:2665347

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2665347.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c048b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com