使用融合乘加加速快速傅里叶变换计算的向量化方法
【图文】:
算,包括16个向量处理单元(VectorProcessingElement,VPE),每个VPE含一个局部寄存器文件,以及3个浮点乘加单元(FloatMultiplyandAccumulate,FMAC)、1个BP和2个L/S共6个并行功能部件,3个FMAC均支持FMA指令。局部寄存器文件包含64个64位寄存器,所有VPE的同一编号的局部寄存器在逻辑上又组成一个1024位的向量寄存器。功能部件支持定点和浮点操作,向量指令在各个VPE上同时独立运行。向量数据访问单元支持向量数据的Load/Store,提供大容量阵列向量存储器(ArrayMemory,AM),每周期同时支持2个Load/Store指令。图1Matrix的体系结构Fig.1ArchitectureofMatrix·73·
0x(2l)Wk2lN+∑N/2-1l=0x(2l+1)Wk(2l+1)N由旋转因子的周期性特性易知:W2klN=WklN/2,Wk+N/2N=-WkN,Wk+NN=WkN令a(l)=x(2l),b(l)=x(2l+1),则序列X(k)划分为2个长度为N/2的子序列:X(k)=A(k)+WkNB(k)X(k+N2)=A(k)+Wk+N2NB(k)=A(k)-WkNB(k{)(1)图2是DIT基2FFT的蝶形单元运算流程图,DIT基2FFT的每次蝶形单元运算需要1次复数乘法,2次复数加法,转变实数计算即为4次实数乘法和6次实数加法,即需要10次实数乘(加)操作。图2DIT基2FFT的蝶形单元运算流程图Fig.2Radix-2DITFFTbutterflydiagram2.1.2DIT基4FFT的蝶形单元计算方法当N是4的整数次方时,DIT基4FFT将输入数据序列x(n)按模4后的余数分组:X(k)=∑N-1n=0x(n)WknN=∑N/4-1l=0x(4l)Wk4lN+∑N/4-1l=0x(4l+1)Wk(4l+1)N+∑N/4-1l=0x(4l+2)Wk(4l+2)N+∑N/4-1l=0x(4l+3)Wk(4l+3)N=∑N/4-1l=0x(4l)WklN/4+WkN∑N/4-1l=0x(4l+1)WklN/4+W2kN∑N/4-1l=0x(4l+2)WklN/4+W3kN∑N/4-1l=0x(4l+3)WklN/4由旋转因子的周期性特性易知:W4klN=WklN/4,Wk+N/4N=-jWkN,Wk+2N/4N=-WkN,Wk+3N/4N=jWkN,Wk+NN=WkN令a(l)=x(4l),b(l)=x(4l+1),,c(l)=x(4l+2),d(l)=x(4l+3),则序列X(k)划分为4个长度为N/4的子序列:X(k)=A(k)+WkNB(k)+W2kNC(k)+W3kND(k)X(k+N4)=A(k)-jWkNB(k)-W2kNC(k)+jW3kND(k)X(k+2N4)=A(k)-WkNB(k)+W2kNC(k)?
【参考文献】
相关期刊论文 前4条
1 刘仲;陈跃跃;陈海燕;;支持任意系数长度和数据类型的FIR滤波器向量化方法[J];电子学报;2013年02期
2 刘仲;邢彬朝;陈跃跃;;一种面向多核处理器的高效并行PCA-SIFT算法[J];国防科技大学学报;2012年04期
3 何涛;朱岱寅;;大点数一维FFT的GPU设计实现[J];计算机工程与科学;2013年11期
4 李焱;张云泉;刘益群;龙国平;贾海鹏;;MPFFT:An Auto-Tuning FFT Library for OpenCL GPUs[J];Journal of Computer Science & Technology;2013年01期
【共引文献】
相关期刊论文 前10条
1 樊明迪;林辉;吕帅帅;;一种抑制PMSM-DTC周期性转速脉动的方法[J];电机与控制学报;2013年09期
2 孙冬;高清维;竺德;卢一相;;离散傅里叶变换的自适应循环电力谐波分析算法[J];安徽大学学报(自然科学版);2013年06期
3 盛建国;朱鸣君;胡瑞;;一种便携式消防救援通信箱系统的设计[J];电脑知识与技术;2013年28期
4 曹鹏;杨锦江;梅晨;;基于粗粒度可重构架构的并行FFT算法实现[J];东南大学学报(自然科学版);2013年06期
5 杨雪;李学友;李家国;马骏;张力;杨健;杜全叶;;基于GPU和分块技术的巨幅影像快速傅里叶变换算法研究(英文)[J];光谱学与光谱分析;2014年02期
6 杨阳;张志荣;倪志波;;基于光闪烁的烟气流速测量技术[J];光电子.激光;2014年04期
7 何其佳;刘振丙;;基于一阶矩的无乘法DFT算法[J];桂林电子科技大学学报;2014年03期
8 常丽;杨继敏;;基于校正多相位快速傅里叶变换算法的叠栅条纹相位差测量[J];光学学报;2014年06期
9 陈大银;;Matlab软件在频谱分析中的应用[J];贵阳学院学报(自然科学版);2014年02期
10 曾博;唐求;卿柏元;温和;李刚;滕召胜;;基于Nuttall自卷积窗的改进FFT谱分析方法[J];电工技术学报;2014年07期
相关会议论文 前2条
1 Wenqiang Guo;Qiang Zhou;Yongyan Hou;Zoe Zhu;Jingjing Yang;Baorong Zhang;;Early Classification for Bearing Faults of Rotating Machinery Based on MFES and Bayesian Network[A];第25届中国控制与决策会议论文集[C];2013年
2 Zhu Jin;Luo Jun;Zhang Shuang;;The Design and Implementation of FFT Algorithm Based on The Xilinx FPGA IP Core[A];2012年计算机应用与系统建模国际会议论文集[C];2012年
相关博士学位论文 前10条
1 陈绪荃;雷电信号特征分析及其分选研究[D];华中科技大学;2013年
2 朱霄s
本文编号:2556835
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2556835.html