基于Trace的安卓3D工作负载缩减方法的研究与实现
发布时间:2020-08-01 07:14
【摘要】:近年来,随着嵌入式系统软硬件的发展,手机和平板电脑逐渐替代台式电脑成为人们购物以及娱乐的首选平台。移动GPU的3D图形渲染能力逐渐成为消费者关注的焦点。为寻求移动GPU架构的最优设计,架构设计者往往需要使用模拟器在多种架构配置下仿真大量的3D工作负载。仿真这一过程十分耗时,大大降低了架构设计效率。为了减少移动GPU架构设计初期的仿真时间,缩减移动3D工作负载显得十分必要。目前,移动平台的操作系统主要为安卓系统。因此,本文借鉴CPU测试程序缩减以及桌面3D工作负载缩减相关研究,构建基于Trace的安卓3D工作负载缩减方法。本文首先分析CPU测试程序缩减以及桌面3D工作负载缩减的相关研究,发现它们均依赖于特定的工具,无法适配当前安卓3D工作负载的缩减。接着,本文为突破现有缩减方法的局限性,借鉴CPU测试程序缩减方法构建基于Trace的安卓3D工作负载缩减方法。该方法的特征为:包含获取Trace文件、生成特征、挑选代表帧以及生成缩减Trace文件这四个步骤。随后,本文基于开源项目Apitrace与GPU性能参数获取器ARM DS5 Streamline完善安卓3D工作负载缩减方案四个步骤所需工具链:Trace获取器、GPU性能参数获取器、Trace播放器以及帧提取器。最后,在包含Mali T628 GPU的Odroid XU4嵌入式开发板上,利用本文的缩减方法完成Antutu 3DBench、3DMark Ice Storm Extreme Demo、3DMark Ice Storm Extreme GT1、3DMark Ice Storm Extreme GT2以及SUV Traffic Racer这五个安卓3D工作负载的缩减。缩减后的3D工作负载帧数平均为原始3D工作负载的2.68%,运行效率平均提升11.5倍。本文在Odroid XU4开发板(Mali T628 GPU)、Firefly RK3399开发板(Mali T860 GPU)、酷比魔方Iwork 8(Intel HD Graphics GPU)以及红米Note 4X(Adreno 506 GPU)上对缩减前后的3D工作负载进行相似性验证。实验结果表明:在GPU变频实验中,缩减后的3D工作负载与原始3D工作负载的FPS平均相关系数达到99.5%以上。
【学位授予单位】:东南大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP332
【图文】:
图 3-1 获取 Trace 文件载在GPU上执行的完整代码商还是开源社区,均提供针对本文主要借助于现有的 TracTracer 的工具主要有:PVRTID[12]。各个工具之间特征如表表 3.1 安卓平台的 Tracer能参数的统计获取应用完整Trace支持 支持 支持 支持 支持 不支持
东南大学硕士学位论文 3D 工作负载执行过程速度降低。但是,获得的 Trace 文件中包含 3D 工作负载发往硬件的全部信息。故而,Trace 文件相比原始 3D 工作负载具备等效的发往硬件 GPU 的执行。因此,可基于 Trace 进行 3D 工作负载的分析[3][28]。.3 Tracer 的输出Tracer 最终输出后缀名为.trace 的压缩文件,该文件可以通过 Apitrace 项目中的 QApitrace进行解析。
图 3-5 生成特征按帧运行 3.1 节中获取的 Trarofiler)获取每一帧的微架构无相关的参数作为每一帧的特征。ace 播放器。如图 3-6 所示,Tr行库。桌面端工具 QApitrace 通ADB)与安卓端通讯模块进行通行依赖于桌面端给安卓端发送播放界面JNI
本文编号:2777144
【学位授予单位】:东南大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP332
【图文】:
图 3-1 获取 Trace 文件载在GPU上执行的完整代码商还是开源社区,均提供针对本文主要借助于现有的 TracTracer 的工具主要有:PVRTID[12]。各个工具之间特征如表表 3.1 安卓平台的 Tracer能参数的统计获取应用完整Trace支持 支持 支持 支持 支持 不支持
东南大学硕士学位论文 3D 工作负载执行过程速度降低。但是,获得的 Trace 文件中包含 3D 工作负载发往硬件的全部信息。故而,Trace 文件相比原始 3D 工作负载具备等效的发往硬件 GPU 的执行。因此,可基于 Trace 进行 3D 工作负载的分析[3][28]。.3 Tracer 的输出Tracer 最终输出后缀名为.trace 的压缩文件,该文件可以通过 Apitrace 项目中的 QApitrace进行解析。
图 3-5 生成特征按帧运行 3.1 节中获取的 Trarofiler)获取每一帧的微架构无相关的参数作为每一帧的特征。ace 播放器。如图 3-6 所示,Tr行库。桌面端工具 QApitrace 通ADB)与安卓端通讯模块进行通行依赖于桌面端给安卓端发送播放界面JNI
【参考文献】
相关博士学位论文 前1条
1 喻之斌;处理器微体系结构模拟加速策略研究[D];华中科技大学;2008年
相关硕士学位论文 前1条
1 李宁;面向安卓应用的CPU基准测试程序合成方法设计与实现[D];东南大学;2017年
本文编号:2777144
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2777144.html