YHFT-QMBase高性能DSP EDMA接口的研究与设计
发布时间:2019-11-06 00:52
【摘要】:为满足日益增长的LTE无线基站和高清视频等计算密集型流媒体应用对数字信号处理器越来越高计算能力的需求,向量并行处理和多核等先进微处理器技术在高性能DSP上被普遍采用,并成为其未来发展的趋势。 在拥有丰富外设的高性能DSP中,外设与各存储器间存在的大量数据交换一般由EDMA部件完成,作为高性能DSP上各个部件间重要的数据通信枢纽,其性能直接影响着芯片的通信带宽和数据的处理性能。因此需要为EDMA设计面向不同外设的专用数据接口,以满足数据传输带宽需求,发挥高性能DSP的数据处理能力。 YHFT-QMBase是国防科学技术大学自主研制的面向软基站的自主知识产权高性能多核DSP,片内集成4个同构DSP单核,本文从YHFT-QMBase的设计需求出发,针对其单核的EDMA接口展开研究和设计,,提出并设计实现了向量重整理缓冲器(VRB)、AXI协议转换和Qlink事务转换等三个专用接口。 YHFT-QMBase的单核采用多宽度SIMD技术,内部集成了16个向量处理单元和高带宽的向量存储器(VM),为解决EDMA与VM数据带宽不匹配造成的VM带宽浪费、向量访存冲突增加等问题,本文利用EDMA访问VM的局部性原理,在EDMA和VM之间设计了VRB,缓存地址连续的访问数据,有效降低了EDMA对VM的访存次数,从而减少了和VPU访问VM的冲突,提高了向量运算的执行效率。 YHFT-QMBase片内集成了带AXI协议的外设部件,为完成其和DSP内核之间的数据传输,本文为EDMA设计了AXI协议转换接口以完成通信协议转换,实现了数据打包解包和异步时钟对接,解决了AXI外设与内核间不同的总线带宽和时钟频率下数据可靠传输的问题。 最后该EDMA还针对YHFT-QMBase中完成多核快速互连功能的Qlink部件设计了Qlink事务转换接口,该接口通过增加二维数据传输、预取读和缓冲写等技术减少和隐藏了数据传输时延。 目前YHFT-QMBase已成功投片,前期的逻辑验证和后期的芯片测试表明,所设计的EDMA接口功能正确,在EDMA和VPU访问VM存在冲突时,使用VRB可以减少92%的访问冲突;AXI协议转换接口满足了RapidIO外设接口以最高传输速率3.125Gbps和芯片存储器之间的流畅通信;Qlink事务转换接口减少了平均186拍事务切换延时。
【图文】:
图 1.1 QMBase 的一种应用场景—LTE 无线通信系统基站基带板系统MBase 采用 65nm 工艺,在 500MHz 的工作频率下,芯片的峰值处理能力可达 4PS、16GFMACS 以及 64GMACS,而功耗不足 9W,完全满足上述 SDR 基带,成功打破国外 3G/4G 高端无线通信基站等计算密集型的高性能 DSP 的技术 QMBase 体系结构图 1.2 所示,YHFT-QMBase DSP 是由四个同构的 YHFT-Matrix(以下简称 支持 Qlink 机制进行四核大粒度的快速数据交互的交叉开关(XBar)和用 处理器进行快速小粒度数据交互及同步控制的共享数据缓冲池(SDP)组成。Q通过增强型直接存储器访问(Enhance Direct Memory Access,以下简称 EDMlink 部件以及中间通路 XBar 来实现。了上述 4 个处理器核与负责四核数据交互和同步的 XBar 和 SDP 两个核心数外,还有丰富的外设:1 个 16 根管脚的 GPIO、2 个 RapidIO、ET 仿真和外(EMIF)等。 GPIO 的 16 个引脚可以通过软件配置为输入或者输出模式,实现向内核输信号和监视内核的功能。
第 3 页图 1.2 YHFT-QMBase DSP 系统结构示意图 单核 Matrix 体系结构如上图 1.2 所示,Matrix 单核采用单指令流多数据流(SIMD)的并行向量计算机体系结构。SPU 和 VPU 共用取指和派发部件。指令由取指部件从(异步静态随机存取存储器)ASRAM 读入 L1P 中,经译码后,由派发部件根据指令类型(标量或向量)分别派发至标量执行单元和向量执行单元。SPU标量执行部件(SPU)则主要负责整个 Matrix 核的中断控制和多线程之间的切换等流水线的控制任务。中断控制器可以响应 28 个中断源,并且每个中断源的优先级可以灵活配
【学位授予单位】:国防科学技术大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP332
本文编号:2556436
【图文】:
图 1.1 QMBase 的一种应用场景—LTE 无线通信系统基站基带板系统MBase 采用 65nm 工艺,在 500MHz 的工作频率下,芯片的峰值处理能力可达 4PS、16GFMACS 以及 64GMACS,而功耗不足 9W,完全满足上述 SDR 基带,成功打破国外 3G/4G 高端无线通信基站等计算密集型的高性能 DSP 的技术 QMBase 体系结构图 1.2 所示,YHFT-QMBase DSP 是由四个同构的 YHFT-Matrix(以下简称 支持 Qlink 机制进行四核大粒度的快速数据交互的交叉开关(XBar)和用 处理器进行快速小粒度数据交互及同步控制的共享数据缓冲池(SDP)组成。Q通过增强型直接存储器访问(Enhance Direct Memory Access,以下简称 EDMlink 部件以及中间通路 XBar 来实现。了上述 4 个处理器核与负责四核数据交互和同步的 XBar 和 SDP 两个核心数外,还有丰富的外设:1 个 16 根管脚的 GPIO、2 个 RapidIO、ET 仿真和外(EMIF)等。 GPIO 的 16 个引脚可以通过软件配置为输入或者输出模式,实现向内核输信号和监视内核的功能。
第 3 页图 1.2 YHFT-QMBase DSP 系统结构示意图 单核 Matrix 体系结构如上图 1.2 所示,Matrix 单核采用单指令流多数据流(SIMD)的并行向量计算机体系结构。SPU 和 VPU 共用取指和派发部件。指令由取指部件从(异步静态随机存取存储器)ASRAM 读入 L1P 中,经译码后,由派发部件根据指令类型(标量或向量)分别派发至标量执行单元和向量执行单元。SPU标量执行部件(SPU)则主要负责整个 Matrix 核的中断控制和多线程之间的切换等流水线的控制任务。中断控制器可以响应 28 个中断源,并且每个中断源的优先级可以灵活配
【学位授予单位】:国防科学技术大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP332
【参考文献】
相关期刊论文 前3条
1 王丹;许虎;;LTE系统中FFT的研究与DSP实现[J];电子技术应用;2011年10期
2 陈发堂;王延双;;LTE系统中混合基FFT算法分析与硬件实现[J];信息通信;2010年02期
3 乔建良,李鉴;DSP技术在移动通信中的应用[J];信息技术;2003年07期
本文编号:2556436
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2556436.html