基于异构平台的HDR视频生成系统的设计及优化
发布时间:2021-08-02 13:14
随着直播、虚拟现实、电子竞技等新兴产业日新月异的发展,人们对于视觉效果的要求越来越严苛。高动态范围成像技术的发展向这些方向的应用也开始引起学者们的注意,但是在传统高动态范围成像技术中,不是其应用条件不符合,就是算法获取一幅高动态范围图像时间过长无法应用到实时视频中。本文目标是利用开放计算语言(Open Computing Language,OpenCL)并行开发框架,针对限制对比度直方图均衡算法,在CPU+GPU、CPU+FPGA和ARM+FPGA三种不同的异构平台上实现算法的加速,并构建基于异构平台的HDR视频生成系统。首先,本文研究了基于OpenCL的异构并行计算技术,探讨了基于GPU和FPGA两种加速设备完成算法并行化的方法。然后深入研究了当前HDR成像算法,对目前成熟的算法通过实验对比了它们的在实现方法、处理速度、可并行化程度等多个方面的优劣,确定限制对比度直方图均衡算法为本文HDR视频系统所要使用算法,并设计了本文实验方案。基于目前较为成熟的CPU+GPU异构平台完成了限制对比度直方图均衡算法的OpenCL并行化。验证了限制对比度直方图均衡算法的可并行化与生成高动态范围视频系...
【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校
【文章页数】:103 页
【学位级别】:硕士
【部分图文】:
OpenCL平台模型
核可以看作是命令队列中命令的集合。当需要处理数据时,主机从当的内核函数提交给 OpenCL 设备,然后再由 OpenCL 设备按照内。内核被认为是 OpenCL 程序的最核心部分,一个 OpenCL 程序的于内核函数的并行化程度。enCL 程序的核心功能其实是利用加速设备的大量计算资源来执行因此执行模型的实质就是怎样调度这些计算资源实现数据计算的最看作是带有编号的工作区间,以便于区分和管理这些 CU,并且每有全局工作索引和 CU 内局部工作索引的。每一个 PE 被认为是一行内核代码的一个线程。被处理数据常见的表现形式有数组、图像和于处理不同维度的数据相应的工作区间也可以被定义为一维、二维penCL 规定全局工作区间为 NDRange,N 最多为 3。全局索引空间工作组,每个工作组又可以分为若干个工作项。对应到工作区间可为一个 PE,一个工作组为一个 CU。OpenCL API 也定义了获取不函数。图 2.2 为一个二维工作区间的例子。
时执行多个内核函数,又有多个计算单元共同完成一个运算操作证并行计算过程中数据的一致性,OpenCL 规定了三种同步方式l fence 同步所有工作项数据的同步;同一个命令队列中使用函数保证前一个指令的执行完成;同一个上下文的不同命令队列之间制来保证数据的一致性,这需要用户将事件关联到命令上完成同同设备的 OpenCL 程序执行流程L 的并行程序可以应用于不同类型的加速设备,其中基于 GPU 的目前研究最久,也是并行化编程最成熟的领域。GPU 由于其自身被看作是一种简单的多线程处理器,但是它又不像普通的 CPU 只它可以同时运行的线程数和 CPU 完全不在一个量级上。而图像处大多在于高额的像素值计算,这种任务是高度并行的,也就是说图独立任务的执行,这样的特性决定了它特别适合在 GPU 上运行。指令使用硬件资源组成电路逻辑完成并行化过程。OpenCL 程序架
【参考文献】:
期刊论文
[1]HDR视频算法优化及硬件实现[J]. 吴安,金西,杜学亮,张克宁,姚春赫,马淑芬. 计算机研究与发展. 2017(05)
[2]高动态范围图像客观质量评价方法[J]. 管非凡,郁梅,宋洋,邵华,蒋刚毅. 计算机应用. 2017(03)
[3]针对动态目标的高动态范围图像融合算法研究[J]. 都琳,孙华燕,王帅,高宇轩,齐莹莹. 光学学报. 2017(04)
[4]高动态范围图像[J]. Janet Lafleur. 办公自动化. 2016(22)
[5]单幅图像的高动态范围图像生成方法[J]. 朱恩弘,张红英,吴亚东,霍永青. 计算机辅助设计与图形学学报. 2016(10)
[6]高动态范围成像研究进展[J]. 白本督,刘军,范九伦. 西安邮电大学学报. 2016(03)
[7]一种适用于并行运算处理的实时高动态范围图像合成算法研究[J]. 王旋,陈忻,刘巍. 影像科学与光化学. 2015(04)
[8]高动态范围视频的多曝光图像序列快速融合[J]. 朴永杰,徐伟,王绍举,陶淑苹. 液晶与显示. 2014(06)
[9]基于自适应分块的动态场景HDR图像合成算法[J]. 李艳梅,罗建,李薇,朱力强. 计算机应用研究. 2014(10)
[10]基于OpenCL的FPGA设计优化方法研究[J]. 范兴山,彭军,黄乐天. 电子技术应用. 2014(01)
硕士论文
[1]基于SoC-FPGA的高动态范围图像合成[D]. 张云.西安电子科技大学 2015
本文编号:3317628
【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校
【文章页数】:103 页
【学位级别】:硕士
【部分图文】:
OpenCL平台模型
核可以看作是命令队列中命令的集合。当需要处理数据时,主机从当的内核函数提交给 OpenCL 设备,然后再由 OpenCL 设备按照内。内核被认为是 OpenCL 程序的最核心部分,一个 OpenCL 程序的于内核函数的并行化程度。enCL 程序的核心功能其实是利用加速设备的大量计算资源来执行因此执行模型的实质就是怎样调度这些计算资源实现数据计算的最看作是带有编号的工作区间,以便于区分和管理这些 CU,并且每有全局工作索引和 CU 内局部工作索引的。每一个 PE 被认为是一行内核代码的一个线程。被处理数据常见的表现形式有数组、图像和于处理不同维度的数据相应的工作区间也可以被定义为一维、二维penCL 规定全局工作区间为 NDRange,N 最多为 3。全局索引空间工作组,每个工作组又可以分为若干个工作项。对应到工作区间可为一个 PE,一个工作组为一个 CU。OpenCL API 也定义了获取不函数。图 2.2 为一个二维工作区间的例子。
时执行多个内核函数,又有多个计算单元共同完成一个运算操作证并行计算过程中数据的一致性,OpenCL 规定了三种同步方式l fence 同步所有工作项数据的同步;同一个命令队列中使用函数保证前一个指令的执行完成;同一个上下文的不同命令队列之间制来保证数据的一致性,这需要用户将事件关联到命令上完成同同设备的 OpenCL 程序执行流程L 的并行程序可以应用于不同类型的加速设备,其中基于 GPU 的目前研究最久,也是并行化编程最成熟的领域。GPU 由于其自身被看作是一种简单的多线程处理器,但是它又不像普通的 CPU 只它可以同时运行的线程数和 CPU 完全不在一个量级上。而图像处大多在于高额的像素值计算,这种任务是高度并行的,也就是说图独立任务的执行,这样的特性决定了它特别适合在 GPU 上运行。指令使用硬件资源组成电路逻辑完成并行化过程。OpenCL 程序架
【参考文献】:
期刊论文
[1]HDR视频算法优化及硬件实现[J]. 吴安,金西,杜学亮,张克宁,姚春赫,马淑芬. 计算机研究与发展. 2017(05)
[2]高动态范围图像客观质量评价方法[J]. 管非凡,郁梅,宋洋,邵华,蒋刚毅. 计算机应用. 2017(03)
[3]针对动态目标的高动态范围图像融合算法研究[J]. 都琳,孙华燕,王帅,高宇轩,齐莹莹. 光学学报. 2017(04)
[4]高动态范围图像[J]. Janet Lafleur. 办公自动化. 2016(22)
[5]单幅图像的高动态范围图像生成方法[J]. 朱恩弘,张红英,吴亚东,霍永青. 计算机辅助设计与图形学学报. 2016(10)
[6]高动态范围成像研究进展[J]. 白本督,刘军,范九伦. 西安邮电大学学报. 2016(03)
[7]一种适用于并行运算处理的实时高动态范围图像合成算法研究[J]. 王旋,陈忻,刘巍. 影像科学与光化学. 2015(04)
[8]高动态范围视频的多曝光图像序列快速融合[J]. 朴永杰,徐伟,王绍举,陶淑苹. 液晶与显示. 2014(06)
[9]基于自适应分块的动态场景HDR图像合成算法[J]. 李艳梅,罗建,李薇,朱力强. 计算机应用研究. 2014(10)
[10]基于OpenCL的FPGA设计优化方法研究[J]. 范兴山,彭军,黄乐天. 电子技术应用. 2014(01)
硕士论文
[1]基于SoC-FPGA的高动态范围图像合成[D]. 张云.西安电子科技大学 2015
本文编号:3317628
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3317628.html
最近更新
教材专著