当前位置:主页 > 科技论文 > 计算机论文 >

面向多媒体图像处理的高效可重构协处理器设计

发布时间:2020-04-05 01:45
【摘要】: 可重构系统中单个可重构单元的结构关系到协处理阵列的硬件资源消耗和功能实现,而且阵列中各单元的通信机制决定着算法的执行效率和配置指令的复杂性。本文基于MorphoSys的结构模型,将优化设计的可重构单元复制构成一个8x8阵列,各单元间采用二维网格结构互联并按照相同的指令对不同的数据操作,实现单指令流多数据流。 本设计提出高效通用可重构协处理器模型,对可重构单元进行了改进,增加一位控制线,使得同行同列的可重构单元在相同配置字下实现不同的功能,增加系统灵活性;同时定义适合于多媒体图像处理算法的配置字格式和指令,设计16x16乘法器,既适用于16位的整数乘法,又支持复数乘法。 对阵列内的互联进行优化,提出三级交叉互联和横向跨象限互联,不仅减少互联资源,而且提高了图像处理中蝶形运算的全局通信效率,特别为多点的FFT和DCT变换提供更高效的数据通路,从而以更简化的指令完成数据处理功能。 本文针对多媒体图像处理中常用的FFT和DCT变换,在灵活性和高效性之间得以折中,以较少的硬件资源大大增强了GRC(General Reconfigurable Cell)功能的灵活性。 最后通过图像处理常用算法的映射,对协处理阵列的性能进行评估。结果显示IGRC(Improved General Reconfigurable Coprocessor)的性能超过同类其它系统。
【图文】:

阵列结构


按照前文对IGRC的定义以及GRC单元和互联的优化,设计的8x8GRA阵列结构如图 27所示,包括64个GRC单元和各单元间的通信资源。最左边为行、列的配置存储器,数据缓冲器,他们在协处理指令下向阵列载入配置字和计算数据,实时地指导GRA阵列的工作。具体对算法进行映射时,只要分析算法、定义相应配置字信息,并存储计算数据。

矩阵乘法,仿真结果


图 28 矩阵乘法仿真结果Fig 28 Simulation result of matrix multiplication8X8 矩阵乘以 8X1 向量运算需要 64 个乘法和 56 个加法,理想情况下假设乘法和加法分别为 1 个周期出结果,对应普通串行的处理器需要 120 个周期,而对应可重构协处理器只需 4 个周期,加上 8 个周期载入数据,总共也只要 12 个周期。大大提高了运算效率。6.2 FFT 算法映射快速傅立叶变换在多媒体处理中有着广泛的应用,,傅立叶分析提供了获取频域信息的一种较为完整的方法,它可以使我们利用频率、幅值和相位来描述时域中的振动波形,事实上傅立叶分析理论涵盖声、光、电、热、量子力学以及自动控制等诸多领域,Garwin 和 Tukey 对其计算方法进行了改进,创造了快速傅立叶变换(简称 FFT这样一种信息处理的技术,使得傅立叶变换在计算机上的运算次数大为减少,求解过程的运算速度加快,提高了数字处理的速度[34][35]。
【学位授予单位】:上海交通大学
【学位级别】:硕士
【学位授予年份】:2008
【分类号】:TP332

【相似文献】

相关期刊论文 前10条

1 樊永友,唐朔飞;面向对象技术在计算机性能评价中的应用[J];计算机工程与应用;2000年06期

2 林晓娴;王维欢;;SIMD-BF模型上的并行FWHT算法研究[J];计算机时代;2011年01期

3 林传文;顾乃杰;雷一鸣;洪一;;分簇VLIW DSP的SIMD编译优化[J];中国科学技术大学学报;2011年08期

4 张发存,赵晓红,沈绪榜;LS SIMD计算机并行计算的面向对象仿真[J];计算机工程与应用;2003年26期

5 于倩;邵洋;张铁军;王东辉;李伟;;基于媒体指令的二维DCT快速计算[J];计算机工程;2007年12期

6 卢仕听;王帅;韩军;曾晓洋;;AES算法的SIMD指令集扩展方法与实现[J];计算机工程;2011年06期

7 H.J.Siegel;王鼎兴;;单指令流多数据流计算机的互连网络[J];计算机研究与发展;1981年07期

8 韩承德;;相联和并行处理机[J];计算机研究与发展;1976年12期

9 张德芳;;登记与插队 一种新颖的控制思想[J];计算机工程与科学;1981年03期

10 孙其梅;岳文元;;SIMD机器的互连网[J];计算机研究与发展;1982年03期

相关会议论文 前1条

1 刘刚;梁晓庚;;基于SIMD硬件指令加速的并行光线跟踪算法[A];第十届中国科协年会论文集(一)[C];2008年

相关硕士学位论文 前3条

1 汪宿梁;面向多媒体图像处理的高效可重构协处理器设计[D];上海交通大学;2008年

2 刘波;基于DirectX9的3D游戏引擎渲染系统的研究与实现[D];沈阳工业大学;2007年

3 庄伟;基于AltiVec技术的向量处理单元ALU设计与实现[D];西北工业大学;2007年



本文编号:2614358

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2614358.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3687a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com