当前位置:主页 > 科技论文 > 计算机论文 >

基于多核VLIW DSP的数字信号变换函数并行优化

发布时间:2017-04-11 06:24

  本文关键词:基于多核VLIW DSP的数字信号变换函数并行优化,由笔耕文化传播整理发布。


【摘要】:伴随着音视频娱乐行业的迅速进步,数字信号处理器正逐渐成为研究人员重点关注的对象,如何提高数字信号处理器平台上相关应用的性能和效率也受到越来越多的重视。然而,当前流行的多核、超标量、单指令流多数据流(Single Instruction,Multiple Data,SIMD)、乱序执行、超长指令字(Very Long Instruction Word, VLIW)技术使得数字信号处理器的体系结构越来越复杂,普通用户很难编写出能够充分发挥处理器性能的软件。 针对特定数字信号处理器平台进行函数库改进是软件优化领域当前重点关注的问题之一,其关键在于提升代码对处理器、存储器等硬件的使用效率。本文针对上述问题,基于国产BWDSP100进行深入研究,针对其搭载的基本信号处理函数库实施并行优化。考虑到该函数库结构复杂、例程数量较多,本文采用重点研究典型函数的方式,对其中最为重要的数字信号变换函数进行优化,使用到的主要优化方案有如下三个层次: (1)利用BWDSP100汇编指令集提供的特殊指令改编函数库中部分函数的实现,从而达到减少代码量,提升程序执行效率的目的。BWDSP100提供的特殊指令包括累加、累减、复数、选大、选小、定点、超算,其中超算指令包括正余弦、倒数、自然对数等。 (2)针对数字信号处理函数循环计算多的特点,通过循环展开技术对函数内的循环操作进行重点优化。循环展开能够成倍的提升每一轮迭代时参与运算的数据个数,这样做的效果是有效的降低了循环体执行的总次数。该技术可以提高软件效率的原因有二:一方面它提高了单次迭代内部有效计算(非索引比较)的数目;另一方面它拉长了程序代码,基于此可以进一步变换代码以便进行指令调度、对变量进行重命名以减少数据相关。 (3)依据BWDSP100支持指令多发射的特点,通过指令调度技术对指令次序进行调整,这样不仅可以减少流水线的空转和等待时间,同时可以提高循环展开的展开数。 实验结果表明,经过优化之后,本文中所有函数的加速均超过9,其中80%的函数加速比超过10。本文的工作成果对其它软件的优化工作有借鉴意义。
【关键词】:超长指令字 单指令流多数据流 数字信号处理 循环展开 并行化 多簇BWDSP100
【学位授予单位】:中国科学技术大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP332
【目录】:
  • 摘要5-6
  • ABSTRACT6-11
  • 第一章 绪论11-17
  • 1.1 研究背景及意义11-13
  • 1.1.1 VLIW DSP概述11-12
  • 1.1.2 本文的研究意义12-13
  • 1.2 国内外研究现状13-15
  • 1.3 本文研究内容15-16
  • 1.4 本文组织结构16-17
  • 第二章 目标平台介绍17-25
  • 2.1 BWDSP100体系结构17-19
  • 2.2 BWDSP100功能部件19-21
  • 2.2.1 算术逻辑单元ALU20
  • 2.2.2 乘法器MUL20
  • 2.2.3 移位器SHF20-21
  • 2.2.4 超算器SPU21
  • 2.3 BWDSP100汇编规则21-23
  • 2.3.1 BWDSP100编程资源约束21-22
  • 2.3.2 BWDSP100寄存器参数传递规则22-23
  • 2.3.3 BWDSP100寄存器文件映射规则23
  • 2.4 函数正确性测试策略23-24
  • 2.5 本章小结24-25
  • 第三章 数学函数模块介绍与优化25-39
  • 3.1 数学函数模块简介25
  • 3.2 SQRT函数优化25-27
  • 3.3 CMUL和CDIV函数优化27-28
  • 3.4 MIN和MAX函数优化28-29
  • 3.5 COS和SIN函数优化29-30
  • 3.6 CUMSUM函数优化30-33
  • 3.7 LN函数优化33
  • 3.8 数学函数模块正确性测试与优化效果评测33-38
  • 3.8.1 数学函数模块正确性测试33-35
  • 3.8.2 数学函数模块优化效果评测35-38
  • 3.9 本章小结38-39
  • 第四章 数字信号变换函数介绍与优化39-61
  • 4.1 FFT和IFFT函数39-43
  • 4.2 DCT和IDCT函数43
  • 4.3 FWHT和IFWHT函数43-45
  • 4.4 HILBERT函数45
  • 4.5 GOERTZEL函数45-46
  • 4.6 UPSAMPLE和DOWNSAMPLE函数46-47
  • 4.7 CONV函数47-48
  • 4.8 UPFIRDN函数48
  • 4.9 函数优化过程描述48-57
  • 4.10 正确性测试与优化效果评测57-60
  • 4.10.1 正确性测试57-58
  • 4.10.2 优化效果评测58-60
  • 4.11 本章总结60-61
  • 第五章 总结和展望61-63
  • 5.1 本文总结61-62
  • 5.2 下一步工作计划和展望62-63
  • 参考文献63-67
  • 致谢67-69
  • 在读期间发表的学术论文与取得的研究成果69

【参考文献】

中国期刊全文数据库 前10条

1 李章林;吴岳;卢桂章;;TMS320C54X DSP汇编程序的几种优化方法[J];电子器件;2006年04期

2 林冰,冯艳,李学明;基于Trimedia DSP的H.264解码算法优化[J];计算机工程与应用;2005年31期

3 张二毛;;DSP的硬件结构特点与程序优化方法[J];内江师范学院学报;2006年02期

4 刘小明;朱艳;;BWDSP100数字信号处理器的指令缓存器设计[J];中国集成电路;2013年04期

5 赵贤鹏,李增智,宋涛,袁飞,冯元,屈科文;一种基于GCC的VLIW编译器指令调度算法[J];微电子学与计算机;2004年01期

6 李红;张晓彤;王沁;;G.729A语音编码算法DSP优化与高速实现[J];小型微型计算机系统;2006年12期

7 黄德天;陈建华;;DSP图像处理的程序优化[J];中国光学与应用光学;2009年05期

8 李世军;;JPEG图像压缩编码算法的DSP优化实现[J];微计算机信息;2012年09期

9 冯玉谦;郑启龙;陈思灵;付和萍;;针对多簇架构的软件流水调度框架设计与实现[J];计算机系统应用;2013年02期

10 徐华叶;郑启龙;丁陈飞;徐东鹏;;面向多簇超长指令字DSP的向量化优化算法[J];计算机系统应用;2013年12期


  本文关键词:基于多核VLIW DSP的数字信号变换函数并行优化,由笔耕文化传播整理发布。



本文编号:298518

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/298518.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d2bf4***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com