基于GPU的并行Turbo乘积码译码器
发布时间:2021-02-20 22:40
Turbo乘积码是一类前向纠错码,在高码率下具有良好的误码率性能。TPC编码器的实现相对简单,其译码器的译码复杂度也比较合理。因此,TPC被广泛用于各种场景,例如卫星通信系统和数据存储系统等。提出了一种基于GPU的并行TPC译码器,可以同时译码二维乘积码矩阵的所有行或列。设计了一种并行基本译码器,以简化由扩展汉明码构成的TPC的译码过程。实现了测试样例和有效码字计算的并行化,降低了译码延迟。为了进一步提高译码吞吐率,提出了多通道TPC译码器。在不同的GPU上测量了并行译码器的性能,实验结果表明,与基于CPU的TPC译码器相比,基于GPU的并行TPC译码器的译码延迟显著降低。此外,基于GPU的并行TPC译码器的吞吐率在NVIDIA RTX 2080 Ti上达到30 Mbps,在NVIDIA GTX Titan V上达到38 Mbps,是基于CPU的TPC译码器性能的44倍和54倍。
【文章来源】:计算机工程与科学. 2020,42(05)北大核心
【文章页数】:9 页
【文章目录】:
1 引言
2 乘积码
3 Chase-Pyndiah译码算法
3.1 汉明码译码
3.2 Chase-Pyndiah算法
4 TPC译码器GPU实现
4.1 GPU和CUDA的架构
4.2 多线程计算和内存层次结构
4.3 并行基本译码器
4.4 多通道译码
4.5 并行TPC译码器
5 实验结果
5.1 延迟和吞吐率
5.2 通道数量
5.3 CUDA流
5.4 不同GPU上的译码
6 结束语
本文编号:3043449
【文章来源】:计算机工程与科学. 2020,42(05)北大核心
【文章页数】:9 页
【文章目录】:
1 引言
2 乘积码
3 Chase-Pyndiah译码算法
3.1 汉明码译码
3.2 Chase-Pyndiah算法
4 TPC译码器GPU实现
4.1 GPU和CUDA的架构
4.2 多线程计算和内存层次结构
4.3 并行基本译码器
4.4 多通道译码
4.5 并行TPC译码器
5 实验结果
5.1 延迟和吞吐率
5.2 通道数量
5.3 CUDA流
5.4 不同GPU上的译码
6 结束语
本文编号:3043449
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3043449.html