面向动态异构多核处理器的公平性任务调度研究

发布时间：2020-10-29 08:31

　　相比于同构多核处理器,异构多核处理器上集成了不同粒度的处理器核心,使用结构复杂、功能强大、功耗高的大核挖掘串行程序的ILP,使用结构简单、占用面积小、功耗低的小核挖掘并行程序的TLP。实际上,当异构多核处理器的大小核配置与任务负载的阶段性行为特征相匹配时才能够有效地提高系统性能和降低功耗。动态异构多核处理器(Dynamic Heterogeneous Chip Multiprocessor, DHCMP)可以动态地将多个同构的基本核重构成不同粒度的逻辑核以满足不同任务的需求,提高系统性能和降低功耗。然而,DHCMP仅仅具有改变逻辑处理器核配置的可能。能否精确感知任务的行为特征和对资源的需求、有效地分配计算资源,能否确保任务执行的公平性,调度算法以及资源分配算法起着重要作用。本文的研究工作为旨在设计新的任务调度算法和资源分配算法以提高DHCMP整体性能、服务质量和能效。本文的研究工作和成果主要包括以下两个方面： 1.设计了逻辑核资源分配算法PCPRA。在每个操作系统调度间隔内,资源分配器先根据任务的数目平均分配逻辑核,运行一定时钟周期后,根据任务的性能(反映任务对资源的需求)对其进行排序,找出对资源需求小的任务,减小所占用的逻辑核的粒度,并将从资源需求小的任务那里获得的空闲基本核分配给对资源需求高的任务,以增加该对资源需求高的任务占用的逻辑核的粒度。 2.分析了在动态异构多核处理器上传统调度算法的不足。根据在DHCMP上任务调度公平性的新的解释,我们设计提出了性能感知的公平性调度算法PDP和PCFS调度算法。这两个调度算法可以动态地感知任务负载的性能,以衡量程序对资源的需求,从而分配相应的逻辑CPU时间,有效地改善了系统的服务质量、性能和能效。实验中,我们通过TFlex模拟器模拟仿真SCMP、ACMP、DHCMP三种不同的处理器平台。首先,在SCMP上分别运行CFS、DWRR、DP调度算法,在ACMP上运行ADWRR调度算法,在DHCMP(采用PERA资源分配算法)上运行DP、CFS、EDP、PDP、PCFS调度算法。实验结果表明,PDP、PCFS调度算法在任务调度公平性、系统性能和能效上占绝对优势。然后,我们实现了PCPRA/PCFS组合,该组合在系统性能上明显优于PERA/PCFS组合,在其他方面也不逊于PERA/PCFS组合,说明PCPRA资源分配算法优于PERA资源分配算法。
【学位单位】：中国科学技术大学
【学位级别】：硕士
【学位年份】：2015
【中图分类】：TP332
【部分图文】：

多核,处理器,方案,并行性

例如图1.1 (b),片上集成了大量的顺序标量处理器核，虽然能够有利于开发线程级并行性，但对于对核的性能敏感（如指令并行性很大）的程序其运行的功率小但执行时间大大增加，既严重影响了性能又没有节省太多功耗。而现实情况是，同时运行的任务是多种多样的，既有串行的，也有并行的。我们既需要提高串行程序的指令集并行度，又要充分挖掘并行程序的线程级并行性，因此，异构多核处理器应运而生。异构多核处理器上放置了不同粒度的处理器核心，既集成了结构复杂功能强大的处理器核心又集成了结构简单功耗低的处理器核心

结构示意图,处理器

而不允许改变IE、LI Icache/Dcache等。因此Wi的逻辑核重构的操作更为简单。通过调整EU的数目，一个逻辑可以是1到8个不等。Pooling (Homayoun et al, 2012)动态异构多核处理器结构在20的研宄小组提出。这种结构中，按照第三维垂直对齐放置处理互共享资源，不同的层之间的通信开销比较小，因此，处理器开销较小的通信实现逻辑核粒度的改变。图1.4 (a)和图1.4 (传统芯片和3D-Pooling结构上处理器核的放置。每个物理核都用程序，能够通过将临近的其他物理核的资源与自己的指令窗处理能力更高的大核。还有，与其他动态异构多核处理器存在差理器结构中每个物理核都为乱序超标量核。虽然通过增加计算提高处理器性能，但是这并不能抵消改变处理器核的配置如指的流水线和缓存的冲刷带来的性能下降，因此在该处理器结辑处理器核的发射宽度以及计算部件的数目，但可以在垂直核指令窗口的大小。

结构示意图,超块,逻辑

图1.5 TFlex结构示意图TFlex由32个相同的物理核组成，如上图1.5所示。所有的物理核都能够独立的执行应用程序；也可以以2的指数倍（1、2、4、8、16、32六种粒度）调整逻辑核粒度来开发指令集并行性。逻辑处理器核的大小决定了其同时运行的超块的数目。但是，当逻辑核由八个以上的物理核构成时，应用程序在上面的性能改善不明显，这主要是由于编译优化的不充分（Gebhartetal，2009)导致。为了解决这个问题，TFlex研宄小组从编译的角度对指令超块进行了优化，并在2013年提出了 TFlex的升级版即T3(SumTetal，2012)结构。Core Fusion的一个优点就是只需要清空后对流水线进行重填即可，可惜该结构只支持2、4两种逻辑核粒度。WiDGET结构中，只是能够改变计算部件和指令窗口的大小，没有必要清空缓存。这样虽然能够实现细粒度的资源调整，但是缩小了处理器核性能的改变范围。3D-Pooling逻辑核的粒度也受到限制。TFlex结构中，编译器在编译程序的过程中就完成了指令超块的划分和数据依赖的分析，只需要硬件动态地改变逻辑核的大小即可。由于TTlex处理器结构中逻辑核的粒度变化范围比较广，本文中我们选用该结构作为我们的研宄平台，
【相似文献】

相关期刊论文前10条

1 张浩;兰峰;;多核处理器基本原理及其在汽车领域中应用的展望[J];汽车科技;2007年03期

2 何军;王飙;;多核处理器的结构设计研究[J];计算机工程;2007年16期

3 肖红;;基于多核处理器系统开发中的几个问题[J];广东广播电视大学学报;2007年04期

4 张健浪;;三大于二,多核CPU之田忌赛马[J];新电脑;2008年06期

5 都思丹;;前言:嵌入式多核处理器系统及视频信号处理技术研究进展[J];南京大学学报(自然科学版);2009年01期

6 黄国睿;张平;魏广博;;多核处理器的关键技术及其发展趋势[J];计算机工程与设计;2009年10期

7 张戈;胡伟武;黄琨;曾洪博;王君;;片上多核处理器的结构级功耗建模与优化技术研究[J];自然科学进展;2009年12期

8 万志涛;章恒;张若渊;;基于多核处理器的深度包检测的实现和性能评估[J];电信科学;2009年S2期

9 李晋惠;寇立涛;乔永兴;;用软件来提高多核处理器性能的方法分析[J];工业仪表与自动化装置;2010年01期

10 严婕;;针对多媒体应用的多核处理器核间通信优化[J];计算机应用与软件;2010年08期

相关博士学位论文前10条

1 王淼;面向多核处理器的并行编译及优化关键技术研究[D];国防科学技术大学;2010年

2 魏海涛;面向多核处理器的数据流程序编译关键技术研究[D];华中科技大学;2010年

3 吕海;多核处理器芯片计算平台中并行程序性能优化的研究[D];北京工业大学;2012年

4 李建华;片上多核处理器缓存子系统优化的研究[D];中国科学技术大学;2013年

5 杜建军;共享高速缓存多核处理器的关键技术研究[D];重庆大学;2011年

6 陈锐忠;非对称多核处理器的若干调度问题研究[D];华南理工大学;2013年

7 邓林;单芯片多核处理器存储优化技术研究[D];国防科学技术大学;2011年

8 吕正;多核处理器存储系统的验证方法研究[D];西北大学;2013年

9 赖明澈;同步数据触发多核处理器体系结构关键技术研究[D];国防科学技术大学;2008年

10 蒋建春;异构多核嵌入式软件关键问题研究[D];重庆大学;2011年

相关硕士学位论文前10条

1 谢子光;多核处理器核间通信技术研究[D];电子科技大学;2009年

2 王兴启;多核处理器的有锁编程与非阻塞算法研究[D];中原工学院;2011年

3 尤凯迪;高性能低功耗多核处理器研究[D];复旦大学;2011年

4 杨国芳;多核处理器核间通信技术研究[D];哈尔滨工程大学;2011年

5 姚宗宝;多核处理器的加速比研究与热设计[D];苏州大学;2012年

6 韩毅宏;多核处理器网络应用研究[D];西安电子科技大学;2010年

7 盛肖炜;多核处理器内部核间通信研究[D];沈阳理工大学;2013年

8 徐军;多核处理器功耗和热量模型研究及实现[D];上海交通大学;2009年

9 奚海波;并行编程技术在多核处理器上的研究与应用[D];东北师范大学;2010年

10 王雪梅;嵌入式多核处理器的仿真器设计[D];国防科学技术大学;2010年

本文编号：2860644

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2860644.html

上一篇：Sb基和Se基相变材料的制备及器件性能研究
下一篇：瓦记录磁盘写特征研究与优化设计

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|