当前位置:主页 > 科技论文 > 信息工程论文 >

HEVC关键模块并行算法的设计与基于GPU的实现

发布时间:2018-05-03 03:37

  本文选题:HEVC + 帧间预测 ; 参考:《大连理工大学》2016年硕士论文


【摘要】:近年来随着高清和超高清视频的发展,视频应用的多样性和高分辨率给以往的视频编码标准带来了极大的挑战。为了能够满足视频应用的需求,2013年国际电信联盟(ITU-T)的视频编码专家组和国际标准化组织(ISO/IEC)的移动视频专家组通力合作,发布了最新一代的视频编码标准——HEVC。相对于H.264/AVC,在相同图像质量的前提下,平均可以减少50%的码率。HEVC在获得出色视频压缩性能的同时其超高的计算复杂度制约了HEVC的广泛应用。为此有必要提高HEVC的编码效率。GPU大量的运算单元非常适合通用并行计算。NVIDIA公司于2007年推出的全新通用并行计算架构(CUDA)采用类C语言为实现大规模可并行的数据任务提供了良好的计算平台。利用GPU的众核特性并行实现视频编码算法已经成为加速视频编码的有效解决方式。本文重点针对HEVC帧间预测和环路滤波的关键模块进行并行算法的设计,并在CUDA平台上编程实现。针对分像素插值,本文设计了一种高效的分像素插值并行算法;针对运动估计环节,本文分别设计了基于梯状并行的整像素和分像素运动搜索算法;针对DCT变换和IDCT变换,本文设计了一种基于蝶形运算的多层级并行算法;针对量化和反量化模块进行并行算法的设计;本文设计了一种全并行的去方块滤波算法;针对样点自适应补偿模块,对边界补偿和边带补偿分别设计了像素分类和信息统计、补偿值求取的并行算法,设计了基于对角结构的参数融合并行算法,设计了全并行的滤波补偿算法。本文在CPU+GPU异构平台上用CUDA语言编程实现了所有设计的并行算法。实验结果表明,对于1080P的高清视频序列,在保证图像重构质量的前提下,与原始串行算法相比,本文设计的并行算法能够取得20倍以上的加速比,能够有效提高帧间回路的编码效率。
[Abstract]:In recent years, with the development of high-definition and ultra-high-definition video, the diversity and high resolution of video applications have brought great challenges to the previous video coding standards. In order to meet the needs of video applications, the Video coding expert Group of the International Telecommunication Union (ITU) in 2013 and the Mobile Video expert Group of ISO / IEC of the International Organization for Standardization (ISO / IEC) jointly issued the latest generation of video coding standard, HEVC. Compared with H.264 / AVC, with the same image quality, the average bit rate can be reduced by 50%. HEVC can achieve excellent video compression performance and its high computational complexity restricts the wide application of HEVC. Therefore, it is necessary to improve the coding efficiency of HEVC. GPU with a large number of computing units is very suitable for general parallel computing. NVIDIA introduced a new universal parallel computing architecture in 2007. It provides a good computing platform. Parallel implementation of video coding algorithm based on GPU's multikernel characteristics has become an effective solution to accelerate video coding. This paper focuses on the design of parallel algorithms for the key modules of inter-frame prediction and loop filtering in HEVC, and implements them on the CUDA platform. For sub-pixel interpolation, this paper designs an efficient sub-pixel interpolation parallel algorithm; for motion estimation, this paper designs the whole pixel and sub-pixel motion search algorithm based on ladder parallel; for DCT transform and IDCT transform, In this paper, we design a multi-level parallel algorithm based on butterfly operation; design a parallel algorithm for quantization and inverse quantization module; design a fully parallel de-block filter algorithm; For boundary compensation and sideband compensation, the parallel algorithms of pixel classification and information statistics, compensation value calculation, parameter fusion parallel algorithm based on diagonal structure and full-parallel filtering compensation algorithm are designed respectively. In this paper, all the parallel algorithms are implemented on CPU GPU heterogeneous platform with CUDA programming language. The experimental results show that the parallel algorithm designed in this paper can achieve a speedup ratio of more than 20 times compared with the original serial algorithm under the premise of guaranteeing the image reconstruction quality for 1080P high-definition video sequences. It can effectively improve the coding efficiency of the inter-frame loop.
【学位授予单位】:大连理工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN919.81

【相似文献】

相关期刊论文 前10条

1 徐云;孙广中;郑启龙;吴俊敏;陈国良;;“并行算法”课程的教学与探讨[J];教育与现代化;2008年04期

2 陈国良;孙广中;徐云;吕敏;;并行算法研究方法学[J];计算机学报;2008年09期

3 罗贵章;陈忠伟;;并行算法综述[J];计算机光盘软件与应用;2013年15期

4 谢铁柱;吴功广;;多项式几种并行算法的比较与优化[J];计算机工程与科学;1981年01期

5 李晓梅 ,胡庆丰;并行算法的发展与展望[J];计算机工程与科学;1991年03期

6 童丽,王正明,曾泳泓;自变量选择及其并行算法[J];数值计算与计算机应用;2001年03期

7 陈国良;昔日王榭堂前燕,飞入寻常百姓家浅谈并行算法[J];新电脑;2002年12期

8 李晓梅;《可扩展并行算法的设计与分析》简介[J];装备指挥技术学院学报;2003年02期

9 吴磊,芦东昕,方马;并行算法中的指针转移技术分析[J];计算机工程;2003年22期

10 雷英杰,霍红卫;典型并行算法的实现性能分析[J];空军工程大学学报(自然科学版);2003年05期

相关会议论文 前10条

1 姚向东;;并行算法到并行结构的映射[A];中国工程物理研究院科技年报(2001)[C];2001年

2 高华;苗世光;;城市小区尺度模式并行算法研究[A];中国气象学会2006年年会“中尺度天气动力学、数值模拟和预测”分会场论文集[C];2006年

3 王志成;吴颂平;;多块结构网格并行算法研究[A];北京力学会第20届学术年会论文集[C];2014年

4 焦龙;郭亚红;纪守领;李金宝;;基于多核计算机的分子动力学并行算法的实现[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年

5 张衡;张武;;三维抛物型初边值问题的块三对角可扩展并行算法[A];2007年全国开放式分布与并行计算机学术会议论文集(上册)[C];2007年

6 王雷章;张爱武;刘晓萌;;三维建模中平面分割并行算法的设计与实现[A];中国系统仿真学会第五次全国会员代表大会暨2006年全国学术年会论文集[C];2006年

7 毛韶阳;李肯立;;一种基因数据的聚类并行算法研究[A];2007年全国开放式分布与并行计算机学术会议论文集(上册)[C];2007年

8 左墨;蔺小林;;电力系统暂态稳定并行算法的进展[A];第二届中国水利水电岩土力学与工程学术讨论会论文集(二)[C];2008年

9 樊洪明;李先庭;赵彬;任鸿泽;;有限元分布式并行算法研究[A];全国暖通空调制冷2002年学术年会论文集[C];2002年

10 侯有政;张方;;基于CUDA的动载荷频域识别的并行算法研究[A];第十届全国振动理论及应用学术会议论文集(2011)上册[C];2011年

相关重要报纸文章 前4条

1 ;并行算法研究进展[N];中国计算机报;2004年

2 新华社记者 奚启新 本报通讯员 李汛 记者 喻国英;精彩人生[N];光明日报;2005年

3 新华社记者 奚启新 本报记者 廖文根;三次选择 无怨无悔[N];人民日报;2005年

4 清华大学计算机系 薛巍;电网仿真考验高性能计算[N];计算机世界;2006年

相关博士学位论文 前10条

1 任立波;稠密颗粒两相流的CFD-DEM耦合并行算法及数值模拟[D];山东大学;2015年

2 李雪宝;太阳望远镜海量数据并行处理技术研究[D];中国科学院研究生院(云南天文台);2015年

3 马欣荣;微分动力学方程的快速与并行算法研究[D];西安电子科技大学;2015年

4 张艳;分布并行算法设计、分析与实现[D];电子科技大学;2001年

5 杜云飞;容错并行算法的研究与分析[D];国防科学技术大学;2008年

6 潘斌;几何定理机器证明并行算法研究[D];中国科学院研究生院(成都计算机应用研究所);2006年

7 骆志刚;典型结构大型线性方程组的分布式并行算法研究[D];中国人民解放军国防科学技术大学;2000年

8 何霞辉;基于非稳态不可压缩流的可扩张并行算法研究[D];湖南大学;2013年

9 戚晶晶;热物性反问题高效并行算法研究[D];武汉理工大学;2013年

10 张爱清;可扩展数据驱动并行算法研究及应用[D];中国工程物理研究院;2009年

相关硕士学位论文 前10条

1 陈权;基于分布式集群的多摄像头的目标检测和跟踪的并行算法[D];南京理工大学;2015年

2 马焕焕;一类近场动力学问题的并行算法[D];山东大学;2015年

3 朱晓丹;一种神经动力学优化系统的并行算法设计[D];大连理工大学;2015年

4 张源;新一代视频编码技术的并行算法设计与实现[D];大连理工大学;2015年

5 董蕾;基于GPU的图像压缩感知算法并行化研究[D];电子科技大学;2015年

6 蒋昭炎;基于图像的大场景三维重建并行算法研究[D];东北大学;2013年

7 冯杰;基于MIC架构的遥感图像增强类算法并行化研究[D];电子科技大学;2015年

8 郑全刚;并行生物序列算法设计与优化[D];山东大学;2016年

9 周兰花;基于异构计算的电磁仿真并行算法研究[D];湖南大学;2016年

10 李剑威;共形组合激发参数并行算法研究[D];西南石油大学;2016年



本文编号:1836831

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1836831.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0877b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com