基于深度学习的视频编码加速及智能比特分配

发布时间:2021-05-01 00:40
  随着信息多媒体技术的不断发展,高清晰度视频的应用逐步普及,社交媒体上大量的视频数据使得高效的压缩编码技术愈发重要。针对这一需求,视频编码联合小组JCT-VC于2013年开发出新一代视频编码标准HEVC,相比于前一代编码标准H.264/AVC,HEVC能在达到相同的编码质量的情况下,减少50%所需比特。但与此同时,HEVC的编码复杂度大大上升,这也导致HEVC较难被一些实时应用或移动终端所采纳。另一方面,随着计算机视觉、智能数据分析等技术的高速发展,有许多新型的智能应用涌现,例如监控视频分析、医学图像理解等,许多的视频数据需要被压缩传输后经由这些智能应用处理。因此,针对这些智能应用来提升编码效率十分必要。本文围绕降低编码复杂度及智能比特分配两大核心问题,开展了深入的研究。HEVC巨大的帧内编码复杂度来源于灵活多变的编码单元大小以及多达35种的帧内预测模式。我们提出了基于深度学习的加速框架LFHI,满足了多功能的加速需求。首先,我们提出了高效的非对称核卷积神经网络(asymmetric-kernel convolutional neural network,AK-CNN),能够在低复杂度的... 

【文章来源】:中国科学技术大学安徽省 211工程院校 985工程院校

【文章页数】:74 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第1章 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
        1.2.1 HEVC帧内编码加速工作
        1.2.2 智能比特分配工作
    1.3 论文主要工作及结构安排
        1.3.1 论文的研究内容及贡献
        1.3.2 论文的结构安排
第2章 HEVC关键技术及特点
    2.1 HEVC中的块划分技术
    2.2 HEVC中的帧内预测技术
    2.3 HEVC中的率失真优化技术
    2.4 本章小节
第3章 基于深度学习的帧内编码加速
    3.1 快速CU/PU划分算法
        3.1.1 四层分类器架构
        3.1.2 AK-CNN结构
        3.1.3 基于演化算法的门限机制
        3.1.4 多样化的量化参数适应算法
    3.2 快速帧内预测模式选择算法
        3.2.1 最少率失真优化模式
        3.2.2 期望值回归模型
    3.3 实验结果及分析
        3.3.1 EHIC数据集
        3.3.2 实验配置
        3.3.3 CNN训练细节
        3.3.4 快速CU/PU划分算法性能评估
        3.3.5 快速帧内预测模式选择算法性能评估
        3.3.6 总体方案性能评估
        3.3.7 非对称卷积核性能分析
        3.3.8 模型复杂度分析
    3.4 本章小结
第4章 基于深度强化学习的智能比特分配
    4.1 失真评价准则
    4.2 智能比特分配框架
        4.2.1 重要性图生成过程
        4.2.2 强化学习算法流程
    4.3 实验结果及分析
        4.3.1 TBA数据集
        4.3.2 实验配置
        4.3.3 性能评价及分析
    4.4 本章小结
第5章 总结和展望
参考文献
致谢
在读期间发表的学术论文与取得的研究成果



本文编号:3169798

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3169798.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户04f99***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com