当前位置:主页 > 科技论文 > 网络通信论文 >

基于TILE-Gx36多核处理器的HEVC视频并行编码技术的设计与实现

发布时间:2020-05-30 12:41
【摘要】:HEVC作为H.264/AVC后的新一代视频编码标准,其初衷主要是相比于H.264/AVC能够节省一半的码率。然而,由于HEVC引入了新的特性,招致了更高的计算复杂度。伴随着芯片集成化工艺的发展,集成化的众核平台开始面向市场,并成功运用在相关应用上。所以本文选择采用TILE-Gx36集成化众核平台来开展研究工作,深入探究HEVC中可用于并行处理的模块以及语法单元,合理利用平台的众核资源,设计相应的资源调度方案,提升编码效率。本文的主要研究成果包括以下三个方面:(1)设计了一种高并行度的帧内/帧间联合WPP编码方案。由于HEVC中的波前并行算法并行度较低,本文通过分析CTU在帧内和帧间的依赖关系,发现当CTU在帧内编码完成且满足帧间依赖性后,不用等待该帧后续CTU编码完成便能开启后续帧的编码工作,据此进一步提高并行编码的并行度,同时针对实际编码中受限的多核资源,制定相应的资源调度策略,提升多核资源的利用率,加快整体编码进程。(2)设计了一种高并行度的快速运动估计方案。深入分析运动估计并行算法存在的数据间的依赖关系与提高并行度两方面的矛盾,对此通过利用有向无环图有效表示数据间依赖关系,并利用其入度矩阵来更新循环处理后的依赖关系,然后以MER中PU为基础单元进行并行处理,进一步提高运动估计的并行度,整体上提高并行编码加速比。(3)设计了一种快速环路滤波并行方案。经过分析发现,由于环路滤波中的去方块滤波与预测处理、SAO与去方块滤波间均存在一个LCU行的高时延,从而严重影响并行编码效率。对此通过将LCU进行分割处理,实现预测与去方块滤波隔离处理。此时,去方块滤波则无需再间隔一个LCU行的延时,可以更快地对编码后LCU进行处理,SAO在去方块处理后也可以更快进入工作,整体上改善高时延问题,提高编码效率。本文针对所设计的三种方案在多核平台进行实现,分别设计了测试实验和相关对比实验。其中高并行度的帧内/帧间联合WPP编码方案在保证不影响编码质量条件下,并行加速比能够达到9.2;高并行度的快速运动估计并行方案提高了并行度,显著提高了视频编码的速度,其并行加速比可达到30.2;快速环路滤波并行方案降低了该模块与预测编码间的时延,最大并行加速比达到2.98。由实验结果可看出本文所设计的并行编码技术既能保证了视频质量,又提升了并行编码的效率。
【图文】:

框架图,框架图


图 2.1 HEVC 框架图2.3 HEVC 编码结构H.264/AVC 中,视频进行编码时通常是对每一帧图像进行分块处理,且大小固定,但是随着视频序列分辨率的逐渐提升,且图像内容重要性也不一样,只有自适应尺寸的图像块进行编码,才能够方便捕捉图像更多内容,消除视频图像空间上的冗余度。因此 HEVC 编码标准提出了一种与 H.264 标准不同的图像分割方式,不再采用固定尺寸大小的宏块,,而是将编码树单元 CTU(CodingTreeUnit)作为图像分割的基本单元[34]。每个 CTU 包含了同一位置的一个亮度编码块 CTB(Coding Tree Block)和两个色度编码块 CTB。其中,CTU 是图像进行四叉树分割时的基本单元,其包含了 CTB 编码树块以及与 CTB 块相对应的语法元素。CTU 所包含的像素数最大为 64×64,最小为 8×8,当然对于不同深度的每一个 CTU 都可以对其采用四叉树结构进行分解,在四叉树结构的末端,会形成若干编码单元 CU(CodingUnit),编码单元则是 HEVC 标准进行视频编解码操作时最基本的处理单元。图 2.2(a)所示为 CTU 到 CU 的划

示意图,预测模式,角度,帧内预测


整体上使得编码性能进一步改善。帧内预测模式主要用来消除视频图像序列同一帧内处于邻正处于编码阶段像素之间的空间相关性,去除图像的空的8种方向预测模式,HEVC帧内预测的预测角度则显得HEVC 提供了 33 种不同的帧内预测方向,外加平面与直流个都对应着相应的编号。如图 2.4 所示为 HEVC 标准中的模式(模式 0)适用于图像纹理变化趋势缓慢、相对平滑点分别采用不同的预测值;直流预测模式(模式 1)则适块的所有像素均采用同样的预测值。整个 HEVC 帧内预测素的获取、参考像素的滤波、预测像素值的计算。
【学位授予单位】:南京邮电大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TN919.81

【参考文献】

相关期刊论文 前5条

1 宋阳;徐静平;;基于H.264的快速帧间模式选择算法研究[J];计算机与数字工程;2015年11期

2 朱秀昌;李欣;陈杰;;新一代视频编码标准——HEVC[J];南京邮电大学学报(自然科学版);2013年03期

3 王蕾;崔慧敏;陈莉;冯晓兵;;任务并行编程模型研究与进展[J];软件学报;2013年01期

4 蒋晓琳;视频编码技术[J];电信网技术;2003年10期

5 包志华,徐晨;应用89C51实现H.261视频图像压缩编码系统的控制[J];苏州大学学报(自然科学);2001年04期

相关会议论文 前1条

1 吴舜;苏丹;吴佳;李坤;许大卫;刘昀;魏征;;基于Tilera平台的网络细粒度应用行为识别系统[A];2013电力行业信息化年会论文集[C];2013年

相关博士学位论文 前3条

1 高敏;视频图像压缩中熵编码技术研究[D];哈尔滨工业大学;2016年

2 王耀华;数据并行处理器中指令流出的协同性研究[D];国防科学技术大学;2013年

3 李东生;基于高密度计算的多核芯片设计关键技术研究[D];合肥工业大学;2012年

相关硕士学位论文 前4条

1 陈伟国;基于HEVC的码率控制算法[D];宁波大学;2017年

2 肖楠;面向新一代视频编码标准HEVC的低复杂度编码技术研究[D];哈尔滨工业大学;2016年

3 阮宁;相关集之间的数据关联描述及应用研究[D];河南师范大学;2016年

4 张超;基于TILE64的H.264多线程并行编码[D];西安电子科技大学;2011年



本文编号:2688146

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/2688146.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f936c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com