虚拟机环境下基于PMU的NUMA性能剖析方法及工具
本文关键词:虚拟机环境下基于PMU的NUMA性能剖析方法及工具,由笔耕文化传播整理发布。
【摘要】:由于NUMA(Non-Uniform Memory Access)架构良好的可扩展性和易编程性等优点,使得NUMA架构平台成为高性能计算乃至云计算的主要基础设施,同时由于虚拟机的高度隔离性、易于让用户接受、支持不同的操作系统和应用程序、低风险和易于维护等特性,使得虚拟机无论是在个人PC还是在商业服务器上都被使用得非常广泛,NUMA架构硬件设施结合虚拟机技术已经成为云计算中的一种核心的平台环境。在非虚拟化环境下,有较多的性能剖析工具可以用于NUMA平台的性能剖析,也有许多相关的性能剖析与优化的研究成果,从现有的论文和报告中可以看出在虚拟机环境下仍然有许多对NUMA平台优化的工作可做,但由于在虚拟机环境下上层的客户虚拟机无法感知底层的NUMA硬件架构以及相应的性能剖析工具的缺乏,导致在虚拟机环境下对NUMA平台的性能剖析与优化的研究工作相对较少,而且集中在虚拟机管理和vcpu调度上,缺乏从真实平台的微架构角度进行性能剖析和优化。本文旨在提取和归纳NUMA平台的性能因素,设计并实现一种能适应于虚拟机环境下的NUMA平台性能剖析工具,使用此工具,从NUMA平台微架构的角度提出一种能检测和评估虚拟机环境下NUMA平台各节点出现这些性能瓶颈因素的方法,以指导在虚拟机环境下从vcpu调度方面对NUMA平台进行性能优化。本文首先以Intel westmere微架构为例研究NUMA平台的微架构及其访存数据流特点,提取和总结影响NUMA架构性能的主要因素,包括传统的NUMA性能瓶颈因素(访存局部性因素,最后一级cache竞争因素,cache数据共享问题和内存带宽竞争因素)以及本文新提出的GQ缓冲队列的竞争因素,并且设计一个基准程序,通过实验对这五个主要性能因素进行验证和分析说明。接着,在了解了NUMA平台微架构和NUMA平台性能瓶颈问题的基础上,设计并实现一种基于处理器内部性能监控单元(PMU)的适应于虚拟机环境下对NUMA平台进行性能剖析的工具(暂命名为VMMprof)。从公开文献看,VMMprof是首个在xen虚拟机上完善支持NUMA Uncore部分的性能剖析的工具,并且VMMprof灵活的支持用户自定义的剖析模式,支持多用户同时进行不同的性能事件剖析,支持通过远程进行性能剖析,而且拥有良好的图形操作界面。并通过实验对该工具的进行了正确性验证。最后结合前面分析得到的NUMA架构的主要性能瓶颈因素,利用VMMprof工具,提出一种虚拟机环境下NUMA平台各节点的性能瓶颈因素的检测和评估方法,实验结果表明,通过此方法能正确的发现和评估虚拟机环境下底层硬件NUMA平台各个节点的性能瓶颈问题,根据上述分析,我们又从vcpu调度的角度对虚拟机环境下各个节点出现的这些性能瓶颈问题提出了基本的优化思路。
【关键词】:NUMA PMU 虚拟机 性能剖析
【学位授予单位】:深圳大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP302
【目录】:
- 摘要4-6
- Abstract6-10
- 第一章 绪论10-17
- 1.1 研究背景10-11
- 1.2 研究意义11-12
- 1.3 国内外研究现状12-15
- 1.4 论文结构15-17
- 第二章NUMA性能因素分析17-29
- 2.1 NUMA架构17-19
- 2.2 NUMA访存通路19-21
- 2.3 NUMA性能因素的提取与验证21-27
- 2.3.1 实验平台与基准程序22-24
- 2.3.2 测试方法24-25
- 2.3.3 验证与分析25-27
- 2.4 小结27-29
- 第三章VMMprof的设计与实现29-43
- 3.1 虚拟机29-30
- 3.2 性能监控单元(PMU)30-32
- 3.3 总体设计32-33
- 3.4 详细设计33-37
- 3.4.1 hypercall层设计33-34
- 3.4.2 PMU操作功能接口层设计34
- 3.4.3 服务端设计34-35
- 3.4.4 客户端设计35-37
- 3.5 VMMprof测试37-42
- 3.5.1 核内部分的性能剖析37-39
- 3.5.2 Uncore部分性能剖析39-42
- 3.6 小结42-43
- 第四章VM中NUMA性能瓶颈剖析43-58
- 4.1 VM中NUMA布局绑定43-45
- 4.2 性能瓶颈剖析方法与验证45-56
- 4.2.1 访存局部性46-48
- 4.2.2 GQ缓冲队列竞争48-49
- 4.2.3 LLC竞争49-52
- 4.2.4 Sharing overhead52-54
- 4.2.5 IMC带宽竞争54-56
- 4.4 优化思路56
- 4.5 小结56-58
- 第五章 总结与展望58-60
- 5.1 论文总结58-59
- 5.2 展望59-60
- 参考文献60-64
- 致谢64-65
- 攻读硕士学位期间的研究成果65-66
【共引文献】
中国期刊全文数据库 前4条
1 孙琳琳;侯秀萍;朱波;孙士明;高灿;;基于多线程归并排序算法设计[J];吉林大学学报(信息科学版);2015年01期
2 王文义;冉晓龙;;关于多核系统并行程序效率的编程因素及其研究[J];计算机科学;2015年08期
3 唐龙;何冰;张武;;MPI+OpenMP混合编程在三维电磁辐射计算中的应用[J];微电子学与计算机;2014年08期
4 詹治海;;基于混合并行模型的热传导问题研究及测试[J];电子测试;2015年05期
中国博士学位论文全文数据库 前3条
1 张向洪;高超声速流场电磁干扰数值模拟研究[D];南京航空航天大学;2013年
2 王希忠;基于MPI的分段线性混沌映射加密算法的研究[D];哈尔滨理工大学;2014年
3 林天军;二维/三维非结构化动态混合网格变形方法研究[D];大连理工大学;2014年
中国硕士学位论文全文数据库 前5条
1 李滋田;基于OpenMP的多核多线程负载均衡调度策略研究[D];西安工业大学;2014年
2 朱长皓;基于框图模型的自动生成并行代码的研究[D];中国科学技术大学;2014年
3 王雅娟;腔内电阻抗成像正问题边界元法求解的并行计算研究[D];河北工业大学;2014年
4 施伟;GPP平台无线信号通用多线程并行处理技术[D];北京邮电大学;2014年
5 李莹;基于共享存储结构的并行化技术及其优化问题的研究[D];中国石油大学(华东);2013年
本文关键词:虚拟机环境下基于PMU的NUMA性能剖析方法及工具,由笔耕文化传播整理发布。
,本文编号:269760
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/269760.html