HEVC中的DCT硬件架构设计与HLS实现研究
本文关键词:HEVC中的DCT硬件架构设计与HLS实现研究 出处:《西安电子科技大学》2014年硕士论文 论文类型:学位论文
【摘要】:ITU-T和ISO/IEC于2013年1月发布了一项新的视频压缩标准—HEVC。HEVC是继H.264之后的新一代视频压缩标准,与H.264相比,HEVC的压缩效率高出一倍,HEVC标准的出现解决了视频分辨率更高、视频数据量更大、存储和传输变得更加困难等难题。DCT变换在图像视频压缩领域的应用非常广泛,作为视频图像压缩的必要环节,DCT算法是图像视频编码算法中最活跃的研究部分之一。HEVC标准中的DCT变换是非常重要的预压缩过程,由于HEVC标准中需要对视频序列预测多个方向,然后通过压缩反馈获得最佳预测方向,因此需要多次执行DCT部分,所以DCT的高效实现显得十分重要。另外,HEVC对于整幅图像有更为灵活的分块机制,其中大尺寸的分块也会为相应尺寸的DCT变换带来不便,因此对大尺寸DCT变换的硬件实现研究显得尤为迫切。本文主要介绍了HEVC视频压缩编码流程中的DCT变换过程,并针对HEVC中DCT的大尺寸计算这一点,完成了两种DCT硬件架构的设计及HLS(High-level Synthesis)实现。本文的主要工作成果有:提出了以下两种硬件架构(1)基于矩阵相乘的DCT硬件架构及实现。根据资源利用率、处理延迟以及数据吞吐率这三个指标由HLS方法进行综合实现和优化,使得综合结果达到了5.56Gsps的数据吞吐率,满足了4K视频实时传输吞吐率。(2)基于蝶形算法的DCT硬件架构及实现。根据蝶形算法的运算原理,本文采用HLS方法对其进行了设计实现,与已有论文中DCT硬件结构实现结果进行了比较和分析。并以处理延迟以及数据吞吐率作为优化目标进行HLS优化设计,所完成的实现综合结果获得了6.77Gsps的数据吞吐率,比已有文献的实现结果相比获得了更高的数据吞吐率,且该实现可以应用于8K视频实时压缩。本文重点研究了HEVC中的整数DCT变换算法架构设计、HLS实现及其关键技术。在设计过程中解决了资源利用率过高、处理延迟过大和数据吞吐率无法达到目标值等问题;同时采用HLS方法完成了硬件实现,解决了传统硬件开发周期过长的问题,并且能够在一个软件设计上不断迭代出新的应用在不同场景中的硬件架构。最后对上述HLS实现分别完成了RTL功能仿真测试。其中,本文提出的硬件架构和HLS实现方法可广用于4K或8K分辨率视频的实时压缩。
[Abstract]:ITU-T and ISO/IEC in January 2013 released a new video compression standard - HEVC.HEVC H.264 is the second after the new generation of video compression standard, compared with H.264, HEVC compression efficiency is twice as high, HEVC standard solution with high resolution video, video data, storage and transmission become more difficult the problem of.DCT transform is widely used in the field of image and video compression, as a necessary part of video image compression, DCT algorithm is the DCT transform image encoding algorithm in the most active part of the research in.HEVC standard is very important to pre compression process, due to the need to predict the multiple directions of video sequence HEVC standard. Then through the feedback to obtain the best prediction direction compression, so you need DCT part of the implementation of many times, so the efficient implementation of DCT is very important. In addition, HEVC for the whole image is more flexible Block mechanism, the large size of the block will also bring inconvenience to the corresponding size of the DCT transform, so the large size DCT transform hardware research and implementation is particularly urgent. This paper mainly introduces the HEVC video compression encoding process of DCT transform process, and for the HEVC DCT in large size calculation of this point complete the design of two kinds of DCT and HLS hardware architecture (High-level Synthesis). The main contributions of this dissertation are: put forward the following two kinds of hardware architecture (1) and the realization of DCT hardware architecture based on matrix multiplication. According to the resource utilization rate, processing delay and throughput of the three indicators by the method of integrated HLS the implementation and optimization, makes the comprehensive results reached 5.56Gsps data throughput to meet the 4K real-time video transmission throughput. (2) and the realization of DCT hardware architecture based on butterfly algorithm. According to the operation principle of butterfly algorithm in this paper. The HLS method has carried on the design and implementation of DCT hardware structure, the existing results are compared and analyzed. And the processing delay and data throughput as the optimization goal for HLS optimization design, to achieve comprehensive results the obtained 6.77Gsps data throughput rate than the published results obtained and compared a higher data throughput, and the implementation of 8K can be applied to real-time video compression. This paper focuses on the architecture of integer DCT transform algorithm in HEVC design, HLS implementation and its key technology. In the design process to solve the resource utilization rate is too high, excessive processing delay and data throughput can reach the target value. At the same time; using HLS method to complete the hardware implementation, to solve the traditional hardware development cycle is too long, and can in a software design iteration of new applications in the same The hardware architecture of the scene. Finally, the RTL function simulation test is completed for the above HLS implementation. The hardware architecture and HLS implementation method proposed in this paper can be widely used for real-time compression of 4K or 8K resolution video.
【学位授予单位】:西安电子科技大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TN919.81
【相似文献】
相关期刊论文 前10条
1 陈雯菁;;浅析下一代防火墙硬件架构[J];江西通信科技;2012年02期
2 赵翠;张诚;李红滨;潘伟涛;邱智亮;;HINOC系统硬件架构和实现方法[J];广播与电视技术;2011年10期
3 赵维;黄开臣;罗永红;;Hummingbird加密算法的硬件架构设计[J];电子科技;2013年06期
4 ;Blackmagic Design推出支持4K的Thunderbolt设备Ultra Studio 4K[J];影视制作;2012年10期
5 隋春明;陈述;;GIS硬件平台建设实践[J];吉林电力;2009年01期
6 刘振兴;;双向预测帧率变换算法及硬件架构研究[J];电子与封装;2010年06期
7 李剑峰;张江鑫;;基于GM8180的车载DVR硬件架构的设计[J];杭州电子科技大学学报;2012年05期
8 杨鸿骏;;防火墙硬件架构发展漫谈[J];计算机安全;2010年08期
9 万世豪;PXI技术发展与近况[J];现代制造;2003年14期
10 ;轻装上阵——强氧IO系列“轻”产品[J];电视字幕(特技与动画);2007年08期
相关会议论文 前1条
1 李剑峰;张江鑫;;基于GM8180的车载DVR硬件架构的设计[A];浙江省电子学会2012学术年会论文集[C];2012年
相关重要报纸文章 前6条
1 本报记者 甘露;DP xFabric 迪普的变革[N];计算机世界;2014年
2 米笑;从硬件架构着手[N];中国计算机报;2004年
3 程武;3G盛宴仍难品尝[N];中华工商时报;2004年
4 陈翔;罗切斯特城堡的新故事[N];中国计算机报;2008年
5 本报记者 赵艳秋;4G基站硬件架构随“需”应变[N];中国电子报;2010年
6 海涛;脱胎换骨[N];电脑报;2004年
相关硕士学位论文 前7条
1 王荣华;面向C-RAN系统的研究与测试[D];南京理工大学;2015年
2 琚歆;HEVC中的DCT硬件架构设计与HLS实现研究[D];西安电子科技大学;2014年
3 刘学毅;基于嵌入式SoC硬件架构的视线估计算法实现研究[D];天津大学;2012年
4 孙小明;恶劣环境下视频增强算法硬件架构与FPGA验证[D];长春理工大学;2014年
5 李广涛;SAN存储设备的软/硬件架构设计与实现[D];电子科技大学;2009年
6 蔺守河;USB加密卡的硬件架构研究与设计[D];解放军信息工程大学;2006年
7 王宇;嵌入式眼控鼠标系统的硬件架构设计[D];天津大学;2009年
,本文编号:1428403
本文链接:https://www.wllwen.com/kejilunwen/wltx/1428403.html