基于CUDA的HEVC/H.265环路滤波并行优化
发布时间:2023-02-12 09:41
HEVC/H.265(High Efficiency Video Coding)编解码算法的庞大时间开销使得对其并行优化是一个必然趋势。然而现有的环路滤波并行优化相关工作的并行效率并不高,其主要原因在于算法并行度不高且多数研究基于多核平台。由于算法中大量的条件分支判断负载不均衡问题和数据处理过程中的依赖性妨碍其并行化过程,在众核图形处理器GPU(Graphic Processing Unit)上的并行研究则很少涉及。 基于GPU的大规模并行架构机制,根据CUDA(Compute Unified DeviceArchitecture)的编程特性与HEVC中环路滤波算法特征对其进行并行优化。为了使滤波算法在GPU上更加并行友好性,提出了基于CUDA的并行优化机制,该机制采用了多重优化方案来提升滤波效率:首先,采用基于特征向量的指令归一化机制,消除滤波算法中的繁重的分支判断操作,使其适应CUDA计算架构,保证并行效率;其次,改进垂直水平滤波过程,采用基于校正的垂直水平并行加速机制使垂直水平滤波在同一个时间周期进行,提升并发量,提高加速比,其中产生的视频质量的损失可以忽略不计;最后,应用分而治...
【文章页数】:65 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究意义
1.2 问题提出
1.3 国内外研究现状
1.4 课题背景和研究内容
1.5 文章框架结构
2 基于 CUDA 的 HEVC 环路滤波并行优化系统设计
2.1 环路滤波并行优化系统架构设计
2.2 环路滤波并行优化系统功能模块
2.3 环路滤波并行优化系统处理流程
2.4 环路滤波并行优化系统需要解决的关键问题
2.5 本章小结
3 基于 CUDA 的 HEVC 环路滤波并行优化系统实现
3.1 基于特征向量的指令归一化机制
3.2 基于校验的垂直水平加速机制
3.3 其他并行优化策略
3.4 本章小结
4 测试与分析
4.1 测试环境
4.2 像素依赖性分析
4.3 性能对比测试
4.4 视频质量损失
4.5 本章小结
5 总结与展望
致谢
参考文献
附录1 攻读硕士期间申请的软件著作版权
附录2 攻读硕士期间参与的项目
本文编号:3740854
【文章页数】:65 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究意义
1.2 问题提出
1.3 国内外研究现状
1.4 课题背景和研究内容
1.5 文章框架结构
2 基于 CUDA 的 HEVC 环路滤波并行优化系统设计
2.1 环路滤波并行优化系统架构设计
2.2 环路滤波并行优化系统功能模块
2.3 环路滤波并行优化系统处理流程
2.4 环路滤波并行优化系统需要解决的关键问题
2.5 本章小结
3 基于 CUDA 的 HEVC 环路滤波并行优化系统实现
3.1 基于特征向量的指令归一化机制
3.2 基于校验的垂直水平加速机制
3.3 其他并行优化策略
3.4 本章小结
4 测试与分析
4.1 测试环境
4.2 像素依赖性分析
4.3 性能对比测试
4.4 视频质量损失
4.5 本章小结
5 总结与展望
致谢
参考文献
附录1 攻读硕士期间申请的软件著作版权
附录2 攻读硕士期间参与的项目
本文编号:3740854
本文链接:https://www.wllwen.com/kejilunwen/wltx/3740854.html