大点数FFT变换对处理器的运算能力和访存带宽要求非常高,通常是图像处理、雷达信号处理、卫星通信、生物医学等高吞吐、高实时性应用的瓶颈。FFT运算的计算复杂度高,数据通信量大,因此研究高速、低资源消耗、且便于硬件现实的FFT加速器实现技术的工作变得极有实际价值。本文为了适应复杂数字信号处理对不同维度、不同点数的FFT计算任务,在研究一维、二维、三维FFT算法的原理和影响FFT硬件加速器性能的各种因素的基础上,设计了一种变维度FFT硬件加速器。以Xilinx Virtex6 FPGA为验证平台对本文设计的FFT加速器进行了验证,结果表明所设计的FFT加速器功能正确且性能达到系统设计要求。本文的主要研究工作如下:1、研究分析了 FFT的多种算法原理及多种硬件实现结构,通过比较各个算法对应的运算量及硬件实现的复杂度,选择了针对不同任务下不同点数、不同维度下适合实现的基-2FFT面划分并行算法及多路并行处理架构。2、本方案采用体-面-线的数据组织形式,从面和线2个层次展开计算,以面为基本存储单位,以线为基本计算单位,提高了 FFT运算的并行度,减少了处理器间的数据交互。3、通过乒乓预读取的设计和无冲突的地址调整模块,提高了整机的运算访存比。4、本文设计的FFT加速器内含4个并行计算单元,支持IEEE-754标准下的32位单精度浮点数32点到64K点一维FFT运算,32点到256点的二维和三维FFT运算,且具有较强的可扩展性,可根据需要实现m×n×p序列的FFT运算。5、本文的设计已在Xilinx Virtex6 FPGA芯片上进行原型验证,最高工作频率184.88MHz,在功能性正确的基础上同时达到了系统设计提出的性能要求。
【学位授予单位】:合肥工业大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP332
文章目录
致谢
摘要
ABSTRACT
第一章 绪论
1.1 研究背景
1.2 快速傅里叶变换发展现状
1.2.1 FFT算法研究现状
1.2.2 FFT硬件加速器研究
1.2.3 国内外研究现状
1.3 课题来源
1.4 论文结构安排
第二章 FFT算法原理及其硬件实现
2.1 快速傅里叶变换
2.2 变维度FFT算法原理
2.2.1 一维FFT算法原理
2.2.2 二维FFT算法原理
2.2.3 三维FFT算法原理
2.2.4 按基划分的FFT算法原理
2.3 FFT处理器硬件架构
2.3.1 顺序递归结构
2.3.2 级联处理结构
2.3.3 并行迭代结构
2.3.4 阵列处理结构
2.4 本章小结
第三章 FFT加速器的实现方案
3.1 FFT算法的比较和选择
3.1.1 FFT算法运算规律
3.1.2 FFT运算量比较
3.1.3 FFT算法复杂性比较
3.1.4 FFT算法选择
3.2 FFT运算流图的实现方案
3.3 变维度FFT算法方案的比较与选择
3.3.1 块划分并行算法
3.3.2 面划分并行算法
3.3.3 变维度FFT实现方案的选择
3.4 FFT处理器硬件架构的方案
3.5 本章小结
第四章 FFT加速器设计与实现
4.1 FFT加速器架构
4.2 FFT处理器结构
4.3 FFT运算单元
4.3.1 FFT运算单元的模块结构
4.3.2 FFT运算单元功能结构
4.4 数据组织形式
4.5 存储控制策略
4.5.1 外存储控制策略
4.5.2 内存储控制策略
4.6 蝶形运算单元
4.7 地址无冲突设计
4.8 地址产生单元
4.9 预读取设计
4.10 FFT运算流程
4.10.1 FFT整体运算流程
4.10.2 FFT处理器计算流程
4.11 本章小结
第五章 FFT加速器验证和性能评估
5.1 验证目标及方案
5.2 RTL级功能验证
5.3 FFT运算误差分析
5.3.1 一维FFT运算误差分析
5.3.2 二维FFT运算误差分析
5.3.3 三维FFT运算误差分析
5.4 FPGA验证
5.4.1 FPGA验证平台
5.4.2 资源利用率分析
5.5 FFT加速器的性能对比
5.5.1 一维FFT运算的性能
5.5.2 二维FFT运算的性能
5.5.3 三维FFT运算性能
5.6 本章小结
第六章 总结与展望
6.1 总结
6.2 展望
参考文献
攻读硕士学位期间的学术活动及成果情况
【参考文献】
相关期刊论文 前10条
1 施隆照;郭冀闽;;基于802.11ac的FFT/IFFT处理器设计[J];微电子学与计算机;2016年03期
2 刘益群;李焱;张云泉;张先轶;;Memory Efficient Two-Pass 3D FFT Algorithm for Intel~ Xeon Phi~(TM) Coprocessor[J];Journal of Computer Science and Technology;2014年06期
3 张启英;刘亚刚;张淑艳;朱娟;;基于FPGA的硬件加速器设计的研究与应用[J];计算机光盘软件与应用;2013年17期
4 黄志刚;陈鹏;;基于多核矩阵结构处理器的Sobel图像处理[J];中国科技信息;2013年01期
5 方维;孙广中;吴超;陈国良;;一种三维快速傅里叶变换并行算法[J];计算机研究与发展;2011年03期
6 陈知新;;基于FPGA的蝶形运算的设计与实现[J];安徽电子信息职业技术学院学报;2010年05期
7 金国栋;刘向明;陶智;庄绪宗;;基2与混合基快速Fourier变换算法性能比较[J];计算机与数字工程;2010年03期
8 郭宇;王建华;;基于FPGA的FFT处理器的设计[J];微计算机信息;2009年08期
9 刘欢;谢志远;;分裂基FFT算法的讨论与改进[J];通信技术;2008年03期
10 赵冰;仇玉林;吕铁良;黑勇;;采用异步实现的快速傅里叶变换处理器[J];微电子学;2006年04期
相关博士学位论文 前3条
1 侯宁;嵌入式多核处理器设计与实现关键技术研究[D];合肥工业大学;2012年
2 李东生;基于高密度计算的多核芯片设计关键技术研究[D];合肥工业大学;2012年
3 王超;异构多核可重构片上系统关键技术研究[D];中国科学技术大学;2011年
相关硕士学位论文 前10条
1 戴继祥;异构多核片上网络实现与映射方法研究[D];合肥工业大学;2016年
2 江晨露;应用于C-RAN架构的高速可配FFT/IFFT变换器的研究与实现[D];电子科技大学;2015年
3 陈伟;基于多核DSP的通用软件无线电平台设计与实现[D];南京理工大学;2014年
4 杨学鹏;异构多核SoC中大点数FFT加速单元的实现[D];合肥工业大学;2013年
5 邓可远;噪声分析中FFT算法的设计与实现[D];西安电子科技大学;2013年
6 高伟;可配置浮点FFT的ASIC设计[D];华中科技大学;2012年
7 梁赫西;高性能FFT处理器的研究与FPGA实现[D];华中科技大学;2011年
8 李旭鹏;基于PCI总线的高速采集系统的研究与设计[D];西安电子科技大学;2011年
9 曹廷;一个异构多核调度算法及其实现[D];西安电子科技大学;2011年
10 张竺君;基于FPGA的可变点FFT处理器的设计与实现[D];南京理工大学;2009年
本文编号:
2074064
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2074064.html