当前位置:主页 > 理工论文 > 生物学论文 >

面向第三代测序技术的基因组长序列片段比对算法研究

发布时间:2020-11-16 15:23
   随着测序技术不断发展和改进,测得的基因组序列片段数据的特征也在不断变化。为适应当前第三代测序技术,基因组序列比对算法需要进行深入的研究和改进,以便更适合于处理第三代测序技术测得的长序列片段数据。本文重点研究分析了基于哈希和窗口哈希索引定位方法的序列比对算法,包括传统的基于哈希索引的序列比对方法SSAHA(Sequence search and alignment by hashing algorithm)和改进的基于窗口哈希索引的序列比对算法rHAT(Regional hashing-based alignment tool)。在此基础上,本文进行了进一步的改进,提出了基于窗口哈希双索引表和动态定位的长序列比对算法(WHDL)。WHDL算法在参考基因组索引表构建阶段同时建立窗口全局索引表和局部索引表。全局索引表与rHAT建立的窗口索引表相同,局部索引表则是应用于比对处理阶段,以减少重复处理。WHDL算法在命中定位阶段采用动态定位的新理念,在最后比对处理阶段也提出了对应的两种不同的处理方法(WHDL-1和WHDL-2),并应用了改进的SSAHA方法(SSAHA+),降低算法的复杂度。本文对算法进行了大量测试,测试结果显示,相比rHAT算法,WHDL-1算法能进一步减少运行时间,加快比对速度,提高处理效率。本文还简要讨论了算法进行并行化处理的可行性和粒度。本文最后还探讨了采用序列相似度比较的方法进行DNA序列比对定位,也探讨了从信号与噪声的角度来理解基因组规律和基因变异,并对此进行了简要的分析。
【学位单位】:湖南师范大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:Q811.4;TP301.6
【文章目录】:
摘要
ABSTRACT
第一章 绪论
    1.1 课题背景
    1.2 国内外研究现状和分析
    1.3 本文的研究内容
    1.4 本文的创新点
    1.5 本文的组织结构
第二章 基于哈希索引定位的序列比对算法
    2.1 SSAHA算法原理与分析
        2.1.1 SSAHA算法流程概览
        2.1.2 第一阶段索引构建
        2.1.3 第二阶段命中
        2.1.4 第三阶段分析处理
        2.1.5 SSAHA算法分析
    2.2 rHAT算法原理与分析
        2.2.1 rHAT算法流程概览
        2.2.2 第一阶段索引构建
        2.2.3 第二阶段命中定位
        2.2.4 第三阶段比对处理
        2.2.5 rHAT算法分析
    2.3 本章小结
第三章 基于窗口双索引表和动态定位的长序列比对算法
    3.1 WHDL算法的原理详解
        3.1.1 WHDL算法流程概览
        3.1.2 第一阶段索引构建
        3.1.3 第二阶段命中定位
        3.1.4 第三阶段比对处理
    3.2 WHDL算法分析与小结
第四章 算法实验结果和分析
    4.1 模拟数据实验结果比较与分析
    4.2 真实数据实验结果比较与分析
    4.3 结论
第五章 总结与探讨
    5.1 总结
    5.2 探讨
        5.2.1 采用序列相似度比较进行序列比对定位
        5.2.2 基于信号与噪声的基因变异处理构想
参考文献
致谢

【相似文献】

相关期刊论文 前10条

1 李法君;;降解组测序技术及其研究进展[J];生物学教学;2017年04期

2 彭桂兰;陈嘉慧;荣丹箐;;第四代测序技术[J];农村经济与科技;2017年10期

3 王海;;高通量测序技术新名词的理解和辨析[J];中国科技术语;2017年04期

4 权冰娥;李树;;新一代DNA测序技术在法医实践中的应用及其研究进展[J];辽宁警察学院学报;2017年06期

5 郑秋燕;李清;毛华明;冷静;;测序技术的发展对瘤胃元基因组研究的影响[J];黑龙江畜牧兽医;2015年21期

6 韩齐;李媛媛;孙方达;孔保华;陈倩;;新一代测序技术在食品微生物学中的应用[J];食品工业;2016年01期

7 杜兵兵;;第二代高通量测序技术的原理及其在医学中的应用进展[J];中国继续医学教育;2016年03期

8 周莹;许冰莹;;二代测序技术在临床医学上的相关应用[J];昆明医科大学学报;2016年03期

9 乌日拉嘎;徐海燕;冯淑贞;孙志宏;孟和毕力格;张和平;;测序技术的研究进展及三代测序的应用[J];中国乳品工业;2016年04期

10 郭海燕;程国虎;李拥军;张昊;秦康乐;;高通量测序技术及其在生物学中的应用[J];当代畜牧;2016年12期


相关博士学位论文 前10条

1 邹远;核酸单分子操控和单细胞测序[D];厦门大学;2017年

2 朱家楼;泌尿系统相关肿瘤基因组学研究[D];武汉大学;2017年

3 陈科;二代测序平台进行核酸检测的新技术研究[D];东华大学;2018年

4 Arslan Mehboob;利用转录组测序技术研究鸡lambda干扰素在鸡细胞及器官中介导的免疫信号通路[D];中国农业科学院;2019年

5 平捷;高通量测序技术在个性化医疗中的应用[D];上海交通大学;2012年

6 谢为博;基于表达谱芯片和新一代测序技术的高通量基因分型方法的开发[D];华中农业大学;2010年

7 林强;应用第二代高通量测序技术研究哺乳动物转录组以及转录调控机制[D];中国科学院北京基因组研究所;2011年

8 浦丹;两核苷酸实时合成测序技术及其应用研究[D];东南大学;2015年

9 王娜;应用新一代测序技术对肾透明细胞癌转录组的研究[D];吉林大学;2012年

10 聂小军;基于高通量测序技术的小麦和紫茎泽兰基因组学初步研究[D];西北农林科技大学;2013年


相关硕士学位论文 前10条

1 靳柯;基于双线性回归的单细胞测序数据去噪算法研究[D];华中师范大学;2019年

2 柴贵娟;基于高通量测序技术对喉癌相关长链非编码RNA的初步筛选及鉴定[D];吉林大学;2019年

3 周佩霞;面向第三代测序技术的基因组长序列片段比对算法研究[D];湖南师范大学;2019年

4 王骏;基于深度测序技术的柑桔衰退病毒新基因型鉴定研究[D];西南大学;2019年

5 刘娇;采用高通量测序筛选MC4R下游基因表达谱及验证[D];郑州大学;2019年

6 方银瑞;基于Hadoop平台的下一代测序数据处理算法研究[D];西北农林科技大学;2019年

7 李盛源;新一代高通量测序数据校正方法研究[D];哈尔滨工程大学;2018年

8 潘笑;盐胁迫甘草愈伤组织转录组测序分析[D];河北大学;2018年

9 吴德亮;基于降维与聚类的单细胞RNA测序数据分析[D];哈尔滨工业大学;2018年

10 邵韦涵;利用高通量测序技术对“黄优1号”黄颡鱼杂交优势的初步解析[D];华中农业大学;2018年



本文编号:2886388

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/swxlw/2886388.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户fd0f3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com