面向多媒体图像处理的高效可重构协处理器设计
【图文】:
按照前文对IGRC的定义以及GRC单元和互联的优化,设计的8x8GRA阵列结构如图 27所示,包括64个GRC单元和各单元间的通信资源。最左边为行、列的配置存储器,数据缓冲器,他们在协处理指令下向阵列载入配置字和计算数据,实时地指导GRA阵列的工作。具体对算法进行映射时,只要分析算法、定义相应配置字信息,并存储计算数据。
图 28 矩阵乘法仿真结果Fig 28 Simulation result of matrix multiplication8X8 矩阵乘以 8X1 向量运算需要 64 个乘法和 56 个加法,理想情况下假设乘法和加法分别为 1 个周期出结果,对应普通串行的处理器需要 120 个周期,而对应可重构协处理器只需 4 个周期,加上 8 个周期载入数据,总共也只要 12 个周期。大大提高了运算效率。6.2 FFT 算法映射快速傅立叶变换在多媒体处理中有着广泛的应用,,傅立叶分析提供了获取频域信息的一种较为完整的方法,它可以使我们利用频率、幅值和相位来描述时域中的振动波形,事实上傅立叶分析理论涵盖声、光、电、热、量子力学以及自动控制等诸多领域,Garwin 和 Tukey 对其计算方法进行了改进,创造了快速傅立叶变换(简称 FFT这样一种信息处理的技术,使得傅立叶变换在计算机上的运算次数大为减少,求解过程的运算速度加快,提高了数字处理的速度[34][35]。
【学位授予单位】:上海交通大学
【学位级别】:硕士
【学位授予年份】:2008
【分类号】:TP332
【相似文献】
相关期刊论文 前10条
1 樊永友,唐朔飞;面向对象技术在计算机性能评价中的应用[J];计算机工程与应用;2000年06期
2 林晓娴;王维欢;;SIMD-BF模型上的并行FWHT算法研究[J];计算机时代;2011年01期
3 林传文;顾乃杰;雷一鸣;洪一;;分簇VLIW DSP的SIMD编译优化[J];中国科学技术大学学报;2011年08期
4 张发存,赵晓红,沈绪榜;LS SIMD计算机并行计算的面向对象仿真[J];计算机工程与应用;2003年26期
5 于倩;邵洋;张铁军;王东辉;李伟;;基于媒体指令的二维DCT快速计算[J];计算机工程;2007年12期
6 卢仕听;王帅;韩军;曾晓洋;;AES算法的SIMD指令集扩展方法与实现[J];计算机工程;2011年06期
7 H.J.Siegel;王鼎兴;;单指令流多数据流计算机的互连网络[J];计算机研究与发展;1981年07期
8 韩承德;;相联和并行处理机[J];计算机研究与发展;1976年12期
9 张德芳;;登记与插队 一种新颖的控制思想[J];计算机工程与科学;1981年03期
10 孙其梅;岳文元;;SIMD机器的互连网[J];计算机研究与发展;1982年03期
相关会议论文 前1条
1 刘刚;梁晓庚;;基于SIMD硬件指令加速的并行光线跟踪算法[A];第十届中国科协年会论文集(一)[C];2008年
相关硕士学位论文 前3条
1 汪宿梁;面向多媒体图像处理的高效可重构协处理器设计[D];上海交通大学;2008年
2 刘波;基于DirectX9的3D游戏引擎渲染系统的研究与实现[D];沈阳工业大学;2007年
3 庄伟;基于AltiVec技术的向量处理单元ALU设计与实现[D];西北工业大学;2007年
本文编号:2614358
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2614358.html