基于混合架构的双通道实时相关器实现
发布时间:2020-02-20 22:06
【摘要】:为满足多波束接收机、焦面阵和天线阵等超大数据量终端的处理需求,采用以GPU并行运算为处理核心的FPGA+CPU+GPU混合架构对天文相关器进行设计,利用严格时序的FPGA进行采样和预处理,基于统一计算设备架构平台开发实现GPU并行运算信号处理与CPU逻辑控制、存储和显示。测试结果表明,该相关器运行稳定、准确,通过调节混频、滤波和傅里叶变换参数即可实现通带范围内任意频带的高精度测量。
【图文】:
可,使计算量得到大幅的简化,优化了软硬件资源并节省了计算时间,该类型的相关机被称为FX型相关机[12],文中即采用了该设计原理。通过相关计算可获得两信号的自相关幅度A*·A,B*·B,该结果即为各通道的功率谱,即信号的频谱;还可获得两信号互相关的实部ABre和虚部ABim,根据式(1)进行转换即可得到互相关的幅度和相位,该类型相关机在甚长基线干涉测量(VLBI)[13]和全息法测量[14-15]等天文观测中应用较多。Amp=AB2re+AB2i醝mPhase=arctan(ABim/ABre)(1)图1FX型相关机原理4系统硬件架构基于混合架构的实时相关器系统硬件架构如图2所示,FPGA部分采用美国伯克利大学天文信号处理与电子研究组织(CASPER)提供的可重构开放式架构硬件计算平台(ROACH),,负责数据的高速采集与传输,该平台采用XilinxVirtex5FPGA处理芯片,与A/D采样板采用Z-DOK连接方式,配备有4个10GbE的万兆以太网模块,采用10GbE电缆直接与计算机端的10GbE模块连接以便数据的高速实时读龋ROACH板与计算机间的通信与控制采用普通以太网的连接方式。计算机端配备有Nvidia最新的GPU处理器GeForceGTXTITAN,含有2688个CUDA核,内存访问带宽为288.4GB/s,采用PCIExpress3.0×16接口与计算机连接,数据交换速率能达到32GB/s。43
计算机工程2016年5月15日图2系统硬件框图5系统软件设计系统软件设计分为FPGA开发和基于CUDA的CPU+GPU混合编程两部分,当前所使用的AD采样为双通道200Mb/s,8bit,数据速率为3.2Gb/s,经实测,10GbE网络的最大有效传输速率约为9.5Gb/s,足够满足两通道信号的实时传输。对于多波束、焦面阵或天线阵产生的多通道、宽带宽、高精度的超大数据量来说,由于终端处理器传输带宽的限制,一般先将数据保存到存储服务器上,然后再进行后处理。本文仅对双通道窄带信号进行相关,数据只需先暂存到服务器的存储硬盘上,然后再从硬盘上读取数据进行实时处理,由于GPU的运算效率极高,因此可实现信号数据的实时采集与处理。服务器的存储采用了SATA36Gb/s接口平台的固态硬盘,其读写速率最大分别可达550MB/s和520MB/s,存储空间为512GB,读写速率足够满足数据传输的要求。系统软件设计规划如图3所示,ROACH完成两通道数据的高速采集、数字混频、滤波并打包发送到10GbE网络,GPU&CPU从10GbE模块读取数据、解包、多相滤波、FFT、交叉相乘、积分并进行存储和显示,CPU还要完成整个系统的逻辑和流程控制。图3系统软件设计规划系统软件流程如图4所示,总体来说,由CPU完成逻辑和流程控制,包括初始化、内存分配与回收、FPGA程序加载与参数配置、CPU与GPU间数据交换、数据获娶存储与显示等;采用FPGA进行采样和预处理、并将数据打包发送到10GbE网络;利用GPU并行运算来完成多相滤波、傅里叶变换、相关运算、积分等信号处理。图4系统软件流程5.1ROACH板软件开发ROACH板软件开发包括ROACH控制软件和FPGA开发,前者主要完成将二进制文件加载到FPGA、初始化配置、网络设置等控制功能,相对简单;后者基于CASPER提供的FPGA开发库,在Mat
本文编号:2581441
【图文】:
可,使计算量得到大幅的简化,优化了软硬件资源并节省了计算时间,该类型的相关机被称为FX型相关机[12],文中即采用了该设计原理。通过相关计算可获得两信号的自相关幅度A*·A,B*·B,该结果即为各通道的功率谱,即信号的频谱;还可获得两信号互相关的实部ABre和虚部ABim,根据式(1)进行转换即可得到互相关的幅度和相位,该类型相关机在甚长基线干涉测量(VLBI)[13]和全息法测量[14-15]等天文观测中应用较多。Amp=AB2re+AB2i醝mPhase=arctan(ABim/ABre)(1)图1FX型相关机原理4系统硬件架构基于混合架构的实时相关器系统硬件架构如图2所示,FPGA部分采用美国伯克利大学天文信号处理与电子研究组织(CASPER)提供的可重构开放式架构硬件计算平台(ROACH),,负责数据的高速采集与传输,该平台采用XilinxVirtex5FPGA处理芯片,与A/D采样板采用Z-DOK连接方式,配备有4个10GbE的万兆以太网模块,采用10GbE电缆直接与计算机端的10GbE模块连接以便数据的高速实时读龋ROACH板与计算机间的通信与控制采用普通以太网的连接方式。计算机端配备有Nvidia最新的GPU处理器GeForceGTXTITAN,含有2688个CUDA核,内存访问带宽为288.4GB/s,采用PCIExpress3.0×16接口与计算机连接,数据交换速率能达到32GB/s。43
计算机工程2016年5月15日图2系统硬件框图5系统软件设计系统软件设计分为FPGA开发和基于CUDA的CPU+GPU混合编程两部分,当前所使用的AD采样为双通道200Mb/s,8bit,数据速率为3.2Gb/s,经实测,10GbE网络的最大有效传输速率约为9.5Gb/s,足够满足两通道信号的实时传输。对于多波束、焦面阵或天线阵产生的多通道、宽带宽、高精度的超大数据量来说,由于终端处理器传输带宽的限制,一般先将数据保存到存储服务器上,然后再进行后处理。本文仅对双通道窄带信号进行相关,数据只需先暂存到服务器的存储硬盘上,然后再从硬盘上读取数据进行实时处理,由于GPU的运算效率极高,因此可实现信号数据的实时采集与处理。服务器的存储采用了SATA36Gb/s接口平台的固态硬盘,其读写速率最大分别可达550MB/s和520MB/s,存储空间为512GB,读写速率足够满足数据传输的要求。系统软件设计规划如图3所示,ROACH完成两通道数据的高速采集、数字混频、滤波并打包发送到10GbE网络,GPU&CPU从10GbE模块读取数据、解包、多相滤波、FFT、交叉相乘、积分并进行存储和显示,CPU还要完成整个系统的逻辑和流程控制。图3系统软件设计规划系统软件流程如图4所示,总体来说,由CPU完成逻辑和流程控制,包括初始化、内存分配与回收、FPGA程序加载与参数配置、CPU与GPU间数据交换、数据获娶存储与显示等;采用FPGA进行采样和预处理、并将数据打包发送到10GbE网络;利用GPU并行运算来完成多相滤波、傅里叶变换、相关运算、积分等信号处理。图4系统软件流程5.1ROACH板软件开发ROACH板软件开发包括ROACH控制软件和FPGA开发,前者主要完成将二进制文件加载到FPGA、初始化配置、网络设置等控制功能,相对简单;后者基于CASPER提供的FPGA开发库,在Mat
【相似文献】
相关期刊论文 前2条
1 姜钊;金声震;姜爱民;贾志宏;;空间太阳望远镜图像积分中1 bit相关器的研究[J];光电子.激光;2007年02期
2 ;[J];;年期
本文编号:2581441
本文链接:https://www.wllwen.com/kejilunwen/tianwen/2581441.html