HXDSP上IDCT变换的数据压缩式向量化设计及实现
发布时间:2022-12-10 05:20
二维离散余弦逆变换(inverse discrete cosine transform,IDCT)是视频解码算法的核心模块之一,也是视频解码算法中运算量和耗时最多的部分,因此提高解码速度的重点在于如何提高IDCT的运算速度。文章基于魂芯数字信号处理器(HXDSP)平台,结合openHEVC中的IDCT算法,设计并实现了一种数据压缩式向量法,该方法利用HXDSP的现有硬件资源构建向量处理器,并将2个相邻的运算数据压缩至寄存器的高位和低位同时参与计算,在硬件资源和周期不变的情况下,数据运算量提高了50%。测试结果表明该算法的运算速度达到了HXDSP的计算峰值32 GMACS,为openHEVC解码器的DSP优化提供了重要的参考。
【文章页数】:6 页
【文章目录】:
1 HXDSP向量处理器
2 IDCT原理及算法分析
2.1 openHEVC中IDCT算法分析
2.2 IDCT计算方法
2.3 数据压缩式向量法IDCT实现
(1) 读数。
(2) 计算。
(3) 写回。
3 实验结果与分析
4 结 论
【参考文献】:
期刊论文
[1]面向龙芯3B1500体系结构的DGEMM函数优化[J]. 刘刚,张恒,毛睿,陆克中. 小型微型计算机系统. 2014(07)
[2]基于向量扩展多核处理器的矩阵乘法算法优化研究[J]. 朱海涛,陈云霁,钱诚,王玲,胡伟武. 中国科学技术大学学报. 2011(02)
博士论文
[1]向量SIMD DSP上高效矩阵运算技术研究[D]. 张凯.国防科学技术大学 2013
本文编号:3716141
【文章页数】:6 页
【文章目录】:
1 HXDSP向量处理器
2 IDCT原理及算法分析
2.1 openHEVC中IDCT算法分析
2.2 IDCT计算方法
2.3 数据压缩式向量法IDCT实现
(1) 读数。
(2) 计算。
(3) 写回。
3 实验结果与分析
4 结 论
【参考文献】:
期刊论文
[1]面向龙芯3B1500体系结构的DGEMM函数优化[J]. 刘刚,张恒,毛睿,陆克中. 小型微型计算机系统. 2014(07)
[2]基于向量扩展多核处理器的矩阵乘法算法优化研究[J]. 朱海涛,陈云霁,钱诚,王玲,胡伟武. 中国科学技术大学学报. 2011(02)
博士论文
[1]向量SIMD DSP上高效矩阵运算技术研究[D]. 张凯.国防科学技术大学 2013
本文编号:3716141
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3716141.html