当前位置:主页 > 科技论文 > 计算机论文 >

面向移动终端软基带算法并行实现的矢量处理器设计

发布时间:2017-09-16 18:46

  本文关键词:面向移动终端软基带算法并行实现的矢量处理器设计


  更多相关文章: 软基带 矢量处理器 算法并行 单指令多数据 超长指令字


【摘要】:当前以LTE/LTE Advanced为代表的第4代移动通信技术(4G)已开始进入商用阶段,LTE-Advanced作为LTE标准的演进除了提供更高的极限吞吐率外还需向前兼容已有的LTE标准,呈现出如下两个方面的特点:①基带处理算法的运算密度不断加大;②协议模式多种多样。这对于以功耗和面积为重要指标的终端基带处理芯片带来了更高的设计要求,须在考虑终端芯片的性能、功耗的同时还要兼顾灵活性和升级成本因素。因此,软件定义无线电的基带处理(软基带)技术因其具有灵活性高、升级成本低等优势,逐渐取代了传统ASIC设计思路成为移动终端芯片发展的趋势。 本论文对采用正交频分复用(OFDM)和多发多收(MIMO)方案的通信系统的基带算法深入分析,核心算法包括FIR滤波、快速傅里叶变换(FFT)、信道估计、MIMO检测和信道译码等,结果显示这些算法在运算量大的同时还具有很好的并行性,这为实现以矢量处理器为主导的软基带处理技术提供了可行性。为此,本论文面向移动终端的基带处理,从算法和硬件实现两个方面综合分析设计并行实现方案,并设计了矢量处理器模型。 论文的研究工作主要从算法分析、矢量处理器模型设计、实现验证三个方面展开: ①算法分析:针对各基带核心算法的原理、运算量需求的特点,研究了各算法的并行实现方案,如:FIR、FFT、Viterbi译码、LDPC译码算法采用算法内部数据的并行,重点解决并行实现过程中的数据访问对齐问题;MIMO信道估计、检测算法主要从任务并行的角度出发,提出了一个一致性较好的软输出算法。 ②矢量处理器模型设计:分析了现有主流的通信基带处理器的结构特点,包括SODA (Signal-processing On-demand Architecture)、Ardbeg、AnySP和TI的C64系列等;在此基础上结合基带算法并行化的特点和需求,提出了一种单指令多数据(SIMD)和超长指令字(VLIW)混合结构的矢量处理器模型。模型首先分析了处理器的设计参数,包括支持的数据定点长度、SIMD宽度、各个功能单元的比例;其次深入研究了处理器的硬件结构,包括算数逻辑运算单元、乘法单元、存取单元、控制和标量单元、寄存器组等;最后给出了指令集的设计和C编译器设计的方法。 ③实现验证:本论文提出的矢量处理器采用LISA语言进行建模仿真,得到了时钟精确的处理器仿真模型及汇编工具链,同时为处理器设计了相应的C编译器。进而通过Processor Designer生成Verilog硬件描述语言,通过ISE综合后,在ML605开发板上做了硬件验证。以FFT、FIR算法为例,验证结果显示,论文所提出的矢量处理器实现方案相较TI的C64系列处理器性能有一定提升。
【关键词】:软基带 矢量处理器 算法并行 单指令多数据 超长指令字
【学位授予单位】:中国科学技术大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TN929.5;TP332
【目录】:
  • 摘要5-7
  • ABSTRACT7-12
  • 第1章 绪论12-20
  • 1.1 研究背景12-14
  • 1.2 研究现状及趋势14-16
  • 1.2.1 算法并行实现的研究现状14-15
  • 1.2.2 软基带处理器的研究现状及趋势15-16
  • 1.3 研究内容16-17
  • 1.3.1 通信基带核心算法的并行化实现16-17
  • 1.3.2 矢量处理器的设计17
  • 1.3.3 两个研究点的关系17
  • 1.4 本文的组织结构17-20
  • 第2章 通信基带核心算法分析20-30
  • 2.1 FIR滤波算法20-21
  • 2.2 FFT算法21-23
  • 2.3 MIMO信道估计23-25
  • 2.4 MIMO检测25-27
  • 2.5 Viterbi译码27-28
  • 2.6 LDPC译码28-29
  • 2.7 本章小结29-30
  • 第3章 基带核心算法的并行化实现30-50
  • 3.1 FIR的并行方案30-31
  • 3.2 FFT的并行方案31-35
  • 3.2.1 蝶形运算的并行化31-34
  • 3.2.2 旋转因子的存取方案34-35
  • 3.3 MIMO检测的并行方案35-43
  • 3.3.1 搜索树生成列表37-41
  • 3.3.2 遍历列表软输出41-43
  • 3.4 Viterbi译码的并行方案43-45
  • 3.4.1 分支度量的并行化43-44
  • 3.4.2 蝶形加比选更新状态度量的并行化44-45
  • 3.5 LDPC译码的并行方案45-49
  • 3.5.1 变量节点的并行计算45-46
  • 3.5.2 校验节点的并行计算46-49
  • 3.6 本章小结49-50
  • 第4章 矢量处理器的设计50-74
  • 4.1 典型的基带处理器50-53
  • 4.1.1 SODA和Ardbeg处理器50-52
  • 4.1.2 AnySP处理器52-53
  • 4.1.3 TIC64系列处理器53
  • 4.2 设计规划53-60
  • 4.2.1 数据定点长度54-57
  • 4.2.2 SIMD的宽度57
  • 4.2.3 各功能单元的比例57-60
  • 4.3 硬件结构60-66
  • 4.3.1 算数逻辑运算单元(S1、S2)60-62
  • 4.3.2 乘法功能单元(M1、M2)62
  • 4.3.3 存取单元(D0、D1、D2)62-63
  • 4.3.4 控制单元和标量单元(S)63-66
  • 4.3.5 寄存器组66
  • 4.4 指令集设计66-70
  • 4.4.1 控制类指令67
  • 4.4.2 标量运算类指令67-68
  • 4.4.3 矢量运算类指令68
  • 4.4.4 存取类指令68-69
  • 4.4.5 指令编码方式69-70
  • 4.5 C编译器设计70-72
  • 4.6 本章小结72-74
  • 第5章 实现和性能分析74-80
  • 5.1 实现方法74-77
  • 5.1.1 LISA语言简介74-75
  • 5.1.2 Processor Designer软件简介75-76
  • 5.1.3 实现过程76-77
  • 5.2 性能分析77-78
  • 5.3 本章小结78-80
  • 第6章 总结和展望80-82
  • 6.1 工作总结80-81
  • 6.2 工作展望81-82
  • 参考文献82-86
  • 致谢86-88
  • 在读期间发表的学术论文与取得的其他研究成果88

【参考文献】

中国期刊全文数据库 前1条

1 黄双渠;向波;鲍丹;陈峗;曾晓洋;;基于SIMD结构的多标准LDPC译码器的VLSI实现[J];计算机研究与发展;2010年07期



本文编号:864818

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/864818.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户967d7***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com