当前位置:主页 > 科技论文 > 基因论文 >

基因数据压缩算法的并行优化研究

发布时间:2022-10-21 18:06
  随着二代基因测序技术的发展及其在药物研发、疾病诊断等领域的广泛应用,基因测序数据呈现指数级增长。海量的基因测序数据需要有效的压缩方案来减小数据体积,以降低存储、传输测序数据的成本。为此,研究者们提出了多种专用基因测序数据压缩方法。这些方法虽然有效地提高了基因测序数据的压缩比,但是在处理速度等方面关注不足,未能得到实际应用。而另一方面,现代硬件的发展使得多核、向量处理等特性得到普及,GPU等加速设备的可用性也得到提高。利用现代硬件对专用基因数据压缩算法进行并行优化可以大幅提高处理速度,从而增强实用性。基于这一背景,本文研究了利用现代硬件对基因测序数据质量分数专用压缩算法LCQS进行并行优化,分别提出了在多核CPU环境和在CPU-GPU异构环境两个不同环境的优化方案。在多核CPU环境下,本文基于数据并行与流水线并行模式,通过多线程与共享队列实现了并行的LCQS。同时引入了轻量级的索引文件结构,满足高效地处理下游应用对压缩数据的随机访问解压需求。还对PAQ压缩这一耗时较多的重要模块采用向量化进行细粒度并行,可用于加速包括LCQS在内的数据压缩应用。实验结果表明,并行优化的LCQS在保持了高压... 

【文章页数】:65 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第一章 绪论
    1.1 研究背景和意义
    1.2 国内外研究现状
        1.2.1 通用压缩算法
        1.2.2 专用基因数据压缩算法
        1.2.3 压缩算法的并行优化
    1.3 论文的主要工作
    1.4 论文的组织结构
第二章 相关理论和技术
    2.1 FASTQ数据格式
    2.2 现代处理器结构
        2.2.1 CPU架构特点
        2.2.2 GPU架构特点
    2.3 并行计算模型
    2.4 并行程序设计
        2.4.1 问题并行性分析
        2.4.2 并行算法结构设计
        2.4.3 支撑结构设计
        2.4.4 实现机制
    2.5 本章小结
第三章 LCQS算法在多核处理器上并行优化
    3.1 LCQS算法原理及设计
        3.1.1 LCQS算法简介
        3.1.2 LCQS算法流程
    3.2 LCQS算法性能优化分析
    3.3 LCQS算法的并行计算设计
    3.4 LCQS算法的并行程序实现
        3.4.1 程序结构
        3.4.2 数据共享
        3.4.3 线程同步
        3.4.4 向量化优化
        3.4.5 文件结构设计
    3.5 本章小结
第四章 LCQS在异构系统上的并行优化
    4.1 问题分析
    4.2 cuLCQS算法在异构系统上的设计
        4.2.1 并行任务划分
        4.2.2 并行算法流程
    4.3 cuLCQS算法在异构系统上的实现
        4.3.1 CPU与 GPU的交互
        4.3.2 数据组织
        4.3.3 算法参数
    4.4 cuLCQS算法在异构系统上的调优
        4.4.1 循环展开
        4.4.2 缓存分配
    4.5 本章小结
第五章 实验与结果分析
    5.1 LCQS算法在多核处理器上的并行优化实验
        5.1.1 实验环境与实验数据
        5.1.2 压缩效果
        5.1.3 性能优化效果
    5.2 LCQS算法在异构系统上的并行优化实验
        5.2.1 实验环境与实验数据
        5.2.2 压缩效果
        5.2.3 性能优化效果
    5.3 本章小结
总结与展望
参考文献
攻读硕士学位期间取得的研究成果
致谢
附件



本文编号:3696126

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/3696126.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b7b79***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com