应用于基因测序的Smith-Waterman算法的研究及FPGA实现
发布时间:2022-01-15 18:11
基因测序是生物信息学领域中重要的基础性问题,主要是获取基因序列中的信息,进行基因测序的根本方法是基因序列比对。目前,基因序列比对在临床医学上有着十分重要的作用,分析人类基因信息,可为医生在诊断,治疗病人时,提供极大的参考,也可以为人们预防疾病提供帮助。随着新一代测序仪器与测序技术的快速发展,基因测序的成本大大降低,基因数据库中的碱基数量大幅度增加。进行基因序列比对需要分析的碱基数量出现了极大的增长,而现有的计算资源与序列比对算法的计算速度,已经难以匹配目前基因测序数据数量的增长速度,导致出现速度失配问题。针对这一问题,本文提出了一种基于CPU-FPGA的Smith-Waterman算法的硬件加速方案。本设计对Smith-Waterman算法的计算原理进行分析,根据该算法在碱基序列计算得分的过程中,反对角线上的数据互不依赖的特征,结合动态规划思想,在序列打分部分提出了并行循环计算方案。在回溯部分,使用两个BRAM阵列,使保存回溯路径和回溯可同时进行。本文基于CPU+FPGA的异构平台,采用Open CL标准,实现该算法的硬件加速,解决了序列比对的速度失配问题。在实现整个系统的过程中,通过...
【文章来源】:深圳大学广东省
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
异构平台系统设计图
型或算法,在两个或多个序列之间找出最优匹配的碱基序列,比对的结果反映了已知序列和目的序列之间相似性的程度以及它们的生物学特征。序列比对是生物信息计算中的核心,也是生物学中最基本、最重要的一个方法。按照同时参与比对的序列条数,分为多序列比对和双序列比对;从进行比对的序列范围考虑,分为全局序列比对和局部序列比对[26]。一般研究的序列比对多为双序列比对,双序列比对的研究是多序列比对的基矗参与序列比对的两条序列分别参考序列与目的序列。在全局范围内将两条序列进行比对打分的方法称为全局序列比对,如图2-1,适用于非常相似且长度也大致相等的序列;局部比对序列是一种匹配子序列的序列比对方法,如图2-2,适用于某些片段相似的序列。图2-1全局序列比对示意图图2-2局部序列比对示意图假设进行序列比对的参考序列是S=s1s2s3...si,目的序列是T=t1t2t3...tj,其中i,j分别表示参考序列与目的序列的长度。当参考序列S与目的序列T进行比对,将会出现以下三种情况,分别是:1)插入:目的序列T与参考序列S相比插入了新的序列,参考序列S出现空位。2)删除:目的序列T与参考序列S相比删除了旧的序列,目的序列T出现空位。
嗨菩缘某潭纫约八??的生物学特征。序列比对是生物信息计算中的核心,也是生物学中最基本、最重要的一个方法。按照同时参与比对的序列条数,分为多序列比对和双序列比对;从进行比对的序列范围考虑,分为全局序列比对和局部序列比对[26]。一般研究的序列比对多为双序列比对,双序列比对的研究是多序列比对的基矗参与序列比对的两条序列分别参考序列与目的序列。在全局范围内将两条序列进行比对打分的方法称为全局序列比对,如图2-1,适用于非常相似且长度也大致相等的序列;局部比对序列是一种匹配子序列的序列比对方法,如图2-2,适用于某些片段相似的序列。图2-1全局序列比对示意图图2-2局部序列比对示意图假设进行序列比对的参考序列是S=s1s2s3...si,目的序列是T=t1t2t3...tj,其中i,j分别表示参考序列与目的序列的长度。当参考序列S与目的序列T进行比对,将会出现以下三种情况,分别是:1)插入:目的序列T与参考序列S相比插入了新的序列,参考序列S出现空位。2)删除:目的序列T与参考序列S相比删除了旧的序列,目的序列T出现空位。
【参考文献】:
期刊论文
[1]双序列比对算法的研究与改进[J]. 李丹. 电子技术与软件工程. 2017(18)
[2]基因测序、基因治疗与精准医疗[J]. 祁鸣,蔡泽泓. 科学24小时. 2016(11)
[3]基于多核流处理器的BLAST并行化算法研究[J]. 裴颂文,王心怡,韦刚,吴百锋. 系统仿真学报. 2011(10)
[4]基于SSE2的Smith-Waterman算法并行优化[J]. 王艳. 赤峰学院学报(科学教育版). 2011(07)
[5]基于HPM模型的Smith-Waterman算法并行优化[J]. 李玉岗,刘志勇. 计算机工程. 2007(01)
[6]生物信息学概述[J]. 尚彤,张丹,卢铭. 北京大学学报(医学版). 2001(01)
硕士论文
[1]基于SOPC的Smith-Waterman算法硬件加速器的设计与实现[D]. 王刚.电子科技大学 2019
[2]双序列比对Needleman-Wunsch算法研究[D]. 姜鲜桃.内蒙古农业大学 2017
[3]Smith-Waterman算法硬件加速的研究与实现[D]. 陈观君.电子科技大学 2017
[4]基于GPU的BLAST程序的并行计算的研究[D]. 胡娅.浙江理工大学 2011
本文编号:3591087
【文章来源】:深圳大学广东省
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
异构平台系统设计图
型或算法,在两个或多个序列之间找出最优匹配的碱基序列,比对的结果反映了已知序列和目的序列之间相似性的程度以及它们的生物学特征。序列比对是生物信息计算中的核心,也是生物学中最基本、最重要的一个方法。按照同时参与比对的序列条数,分为多序列比对和双序列比对;从进行比对的序列范围考虑,分为全局序列比对和局部序列比对[26]。一般研究的序列比对多为双序列比对,双序列比对的研究是多序列比对的基矗参与序列比对的两条序列分别参考序列与目的序列。在全局范围内将两条序列进行比对打分的方法称为全局序列比对,如图2-1,适用于非常相似且长度也大致相等的序列;局部比对序列是一种匹配子序列的序列比对方法,如图2-2,适用于某些片段相似的序列。图2-1全局序列比对示意图图2-2局部序列比对示意图假设进行序列比对的参考序列是S=s1s2s3...si,目的序列是T=t1t2t3...tj,其中i,j分别表示参考序列与目的序列的长度。当参考序列S与目的序列T进行比对,将会出现以下三种情况,分别是:1)插入:目的序列T与参考序列S相比插入了新的序列,参考序列S出现空位。2)删除:目的序列T与参考序列S相比删除了旧的序列,目的序列T出现空位。
嗨菩缘某潭纫约八??的生物学特征。序列比对是生物信息计算中的核心,也是生物学中最基本、最重要的一个方法。按照同时参与比对的序列条数,分为多序列比对和双序列比对;从进行比对的序列范围考虑,分为全局序列比对和局部序列比对[26]。一般研究的序列比对多为双序列比对,双序列比对的研究是多序列比对的基矗参与序列比对的两条序列分别参考序列与目的序列。在全局范围内将两条序列进行比对打分的方法称为全局序列比对,如图2-1,适用于非常相似且长度也大致相等的序列;局部比对序列是一种匹配子序列的序列比对方法,如图2-2,适用于某些片段相似的序列。图2-1全局序列比对示意图图2-2局部序列比对示意图假设进行序列比对的参考序列是S=s1s2s3...si,目的序列是T=t1t2t3...tj,其中i,j分别表示参考序列与目的序列的长度。当参考序列S与目的序列T进行比对,将会出现以下三种情况,分别是:1)插入:目的序列T与参考序列S相比插入了新的序列,参考序列S出现空位。2)删除:目的序列T与参考序列S相比删除了旧的序列,目的序列T出现空位。
【参考文献】:
期刊论文
[1]双序列比对算法的研究与改进[J]. 李丹. 电子技术与软件工程. 2017(18)
[2]基因测序、基因治疗与精准医疗[J]. 祁鸣,蔡泽泓. 科学24小时. 2016(11)
[3]基于多核流处理器的BLAST并行化算法研究[J]. 裴颂文,王心怡,韦刚,吴百锋. 系统仿真学报. 2011(10)
[4]基于SSE2的Smith-Waterman算法并行优化[J]. 王艳. 赤峰学院学报(科学教育版). 2011(07)
[5]基于HPM模型的Smith-Waterman算法并行优化[J]. 李玉岗,刘志勇. 计算机工程. 2007(01)
[6]生物信息学概述[J]. 尚彤,张丹,卢铭. 北京大学学报(医学版). 2001(01)
硕士论文
[1]基于SOPC的Smith-Waterman算法硬件加速器的设计与实现[D]. 王刚.电子科技大学 2019
[2]双序列比对Needleman-Wunsch算法研究[D]. 姜鲜桃.内蒙古农业大学 2017
[3]Smith-Waterman算法硬件加速的研究与实现[D]. 陈观君.电子科技大学 2017
[4]基于GPU的BLAST程序的并行计算的研究[D]. 胡娅.浙江理工大学 2011
本文编号:3591087
本文链接:https://www.wllwen.com/kejilunwen/dianzigongchenglunwen/3591087.html