基于SOPC的Smith-Waterman算法硬件加速器的设计与实现
发布时间:2021-11-13 04:03
近年来,生物信息学在不断地发展并成为一门重要的学科,国内许多高校和科研院所都在大力发展这一方面的技术,使其有了突飞猛进的发展,并且以大数据为基础的精准医疗将成为我国“十三五”期间重点发展的科学领域,这样使得生物信息学领域更受关注。生物序列分析是现代生命科学领域中重要的基础性研究工作,而进行序列分析的根本就是序列比对。目前美国已经建立起100万人的基因数据库,预计我国的基因数据库将远超此量级,并且伴随着新一代测序技术的迅速发展,所需比对分析的序列数量出现了爆炸性增长的趋势,但在现如今的序列比对技术当中,已经难以找出匹配序列数量迅速增快的技术,随后引发了序列比对速度跟不上序列产生速度的问题。针对这一问题,本文开展了基于SOPC的Smith-Waterman基因序列比对算法硬件加速器的设计实现工作,该研究利用Smith-Waterman算法原理与脉动阵列思想相结合的方法,基于SOPC硬件系统实现算法的高速完成,解决了上述的速度失配问题,具有十分重要的工程应用价值。本文首先对基因数据处理流程进行分析,提取其关键步骤,通过对处理模型进行特征分析,得出其中序列比对环节耗时最严重的结论;随后制定Sm...
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:78 页
【学位级别】:硕士
【部分图文】:
图1-1个人全基因组测序成本发展趋势
图 2-1 碱基替换类型图2)第二种是碱基插入,碱基插入就是在 DNA 基因序列当中的某个位置插个或数个新的碱基,导致原来的序列长度变长产生影响,比如 AAGGTTACTT AAGGATTAACTT。3)第三种是碱基删除,碱基删除就是在 DNA 基因序列当中的某个位置丢个或数个新的碱基,导致原来的序列长度变短产生影响,比如 AAGGTTACTT AGGTTACT。如图 2-2 所示,其为双序列比对时碱基因子产生的替换、插入及删除的示意图匹配 转换 颠换 颠换转换颠换颠换AGCT匹配匹配匹配颠换颠换颠换颠换转换转换
图 2-3 基因序列增长拟合图列比对列比对,它所解决针对的问题就是来判断两个 DNA 或蛋白的序列的、它们在演化上是否可能同源、我们能是否用一个蛋白的功能来预测,将这个问题归结到计算上,就是:找到两个序列的最优或近似最优的的更快,时间更短,量化二者的相似性。本节会以经典的 Needleman-列比对算法、Smith-Waterman 局部序列比对算法以及基于仿射空位-Waterman 算法作为研究对象,具体比较各种算法的差异性。 序列比对基本原理因序列比对就是在寻找序列之间的最优匹配问题,通过计算序列之,从而得到序列之间的生物属性,这就是序列比对的目的。从参与比来划分,序列比对可以分为双序列和多序列比对,其中双序列比对又的基础,进行比对的两条序列,一条叫参考序列,另一条叫目的序列
【参考文献】:
期刊论文
[1]计算生物学中的高性能计算(Ⅱ)—序列分析[J]. 王涛. 计算机工程与科学. 2015(01)
[2]动态规划算法综述[J]. 张莹. 科技视界. 2014(28)
[3]基于FPGA的带回溯的Smith-Waterman算法加速器的设计与实现[J]. 邹丹,窦勇,夏飞,倪时策. 国防科技大学学报. 2009(05)
[4]基因芯片与高通量DNA测序技术前景分析[J]. 滕晓坤,肖华胜. 中国科学(C辑:生命科学). 2008(10)
[5]生物信息学:我们能做什么?[J]. 朱庆华,李亮. 情报理论与实践. 2006(04)
[6]生物序列分析中的若干数学方法[J]. 谢惠民. 高校应用数学学报A辑(中文版). 2005(04)
[7]一种面向生物信息学的可重构加速卡的设计与实现[J]. 张佩珩,刘新春,江先阳. 计算机研究与发展. 2005(06)
[8]Smith-Waterman算法在脉动阵列上的实现及分析[J]. 汪冬,唐志敏. 计算机学报. 2004(01)
博士论文
[1]大规模生物序列分析的高性能算法和模型[D]. 杨矫云.中国科学技术大学 2014
[2]基于多核CPU和GPU的生物序列分析并行算法研究[D]. 赵志恒.国防科学技术大学 2013
[3]生物序列分析算法硬件加速器关键技术研究[D]. 夏飞.国防科学技术大学 2011
硕士论文
[1]Smith-Waterman算法硬件加速的研究与实现[D]. 陈观君.电子科技大学 2017
[2]基于AXI总线的SoC架构设计与分析[D]. 胡景华.上海交通大学 2013
[3]基于AMBA2.0的SoC总线平台的设计[D]. 陆小艳.西安电子科技大学 2012
[4]基于AMBA总线的通用存控设计与实现[D]. 孙志刚.国防科学技术大学 2011
[5]面向生物序列分析的算法加速器关键技术研究[D]. 张阳.国防科学技术大学 2008
[6]嵌入式系统软硬件划分方法的研究[D]. 杜敏.哈尔滨理工大学 2008
[7]生物序列模式发现算法的研究[D]. 赵丽华.西安电子科技大学 2007
[8]关于多序列比对和系统发育分析中的序列空位研究[D]. 史卫峰.中国农业大学 2005
本文编号:3492282
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:78 页
【学位级别】:硕士
【部分图文】:
图1-1个人全基因组测序成本发展趋势
图 2-1 碱基替换类型图2)第二种是碱基插入,碱基插入就是在 DNA 基因序列当中的某个位置插个或数个新的碱基,导致原来的序列长度变长产生影响,比如 AAGGTTACTT AAGGATTAACTT。3)第三种是碱基删除,碱基删除就是在 DNA 基因序列当中的某个位置丢个或数个新的碱基,导致原来的序列长度变短产生影响,比如 AAGGTTACTT AGGTTACT。如图 2-2 所示,其为双序列比对时碱基因子产生的替换、插入及删除的示意图匹配 转换 颠换 颠换转换颠换颠换AGCT匹配匹配匹配颠换颠换颠换颠换转换转换
图 2-3 基因序列增长拟合图列比对列比对,它所解决针对的问题就是来判断两个 DNA 或蛋白的序列的、它们在演化上是否可能同源、我们能是否用一个蛋白的功能来预测,将这个问题归结到计算上,就是:找到两个序列的最优或近似最优的的更快,时间更短,量化二者的相似性。本节会以经典的 Needleman-列比对算法、Smith-Waterman 局部序列比对算法以及基于仿射空位-Waterman 算法作为研究对象,具体比较各种算法的差异性。 序列比对基本原理因序列比对就是在寻找序列之间的最优匹配问题,通过计算序列之,从而得到序列之间的生物属性,这就是序列比对的目的。从参与比来划分,序列比对可以分为双序列和多序列比对,其中双序列比对又的基础,进行比对的两条序列,一条叫参考序列,另一条叫目的序列
【参考文献】:
期刊论文
[1]计算生物学中的高性能计算(Ⅱ)—序列分析[J]. 王涛. 计算机工程与科学. 2015(01)
[2]动态规划算法综述[J]. 张莹. 科技视界. 2014(28)
[3]基于FPGA的带回溯的Smith-Waterman算法加速器的设计与实现[J]. 邹丹,窦勇,夏飞,倪时策. 国防科技大学学报. 2009(05)
[4]基因芯片与高通量DNA测序技术前景分析[J]. 滕晓坤,肖华胜. 中国科学(C辑:生命科学). 2008(10)
[5]生物信息学:我们能做什么?[J]. 朱庆华,李亮. 情报理论与实践. 2006(04)
[6]生物序列分析中的若干数学方法[J]. 谢惠民. 高校应用数学学报A辑(中文版). 2005(04)
[7]一种面向生物信息学的可重构加速卡的设计与实现[J]. 张佩珩,刘新春,江先阳. 计算机研究与发展. 2005(06)
[8]Smith-Waterman算法在脉动阵列上的实现及分析[J]. 汪冬,唐志敏. 计算机学报. 2004(01)
博士论文
[1]大规模生物序列分析的高性能算法和模型[D]. 杨矫云.中国科学技术大学 2014
[2]基于多核CPU和GPU的生物序列分析并行算法研究[D]. 赵志恒.国防科学技术大学 2013
[3]生物序列分析算法硬件加速器关键技术研究[D]. 夏飞.国防科学技术大学 2011
硕士论文
[1]Smith-Waterman算法硬件加速的研究与实现[D]. 陈观君.电子科技大学 2017
[2]基于AXI总线的SoC架构设计与分析[D]. 胡景华.上海交通大学 2013
[3]基于AMBA2.0的SoC总线平台的设计[D]. 陆小艳.西安电子科技大学 2012
[4]基于AMBA总线的通用存控设计与实现[D]. 孙志刚.国防科学技术大学 2011
[5]面向生物序列分析的算法加速器关键技术研究[D]. 张阳.国防科学技术大学 2008
[6]嵌入式系统软硬件划分方法的研究[D]. 杜敏.哈尔滨理工大学 2008
[7]生物序列模式发现算法的研究[D]. 赵丽华.西安电子科技大学 2007
[8]关于多序列比对和系统发育分析中的序列空位研究[D]. 史卫峰.中国农业大学 2005
本文编号:3492282
本文链接:https://www.wllwen.com/projectlw/swxlw/3492282.html
教材专著