当前位置:主页 > 科技论文 > 数学论文 >

全基因组关联分析中SNP数据补缺算法研究与实现

发布时间:2023-04-26 22:54
  2005年全基因组关联分析(GWAS)的成果首次发表,在过去的10年中随着SNP(Single Nucleotide Polymorphism)测序技术的快速发展,全基因组关联分析已逐步在物种重要经济性状、植物育种、基因改良以及人类复杂疾病等方面有所建树,成为一种重要的研究手段。目前已有许多方法可用于SNP检测,但是由于相关技术的约束,无论用哪种检测方法所测出的SNP数据均是带有缺失值的,重新检测则会耗费大量的时间与成本,若对这些缺失值置之不理则会影响后面的GWAS工作。隐马尔可夫模型(HMM)在生物信息学中应用的范围越来越广泛,和其它模型相比,HMM具有应用弹性大、适用范围广、参数往往具有现实意义的特点,本文中的算法所建立的模型就是应用上述特点所改进过的HMM,是一种非齐次的HMM,即状态的转移概率不仅和前一时刻的状态有关还与具体的时刻有关,所以对相应算法,前向-后向算法,Viterbi算法进行了合理且必要的调整以适应改进后的模型。本文通过对HMM的研究以及对现有补缺算法的分析,提出了一种基于HMM的高效、快速的补缺方法。本算法的特点是补缺时所需的生物学信息少,运行速度快,适合对动、...

【文章页数】:63 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第1章 绪论
    1.1 课题背景及研究的目的和意义
    1.2 国内外研究现状
        1.2.1 高通量测序的研究现状
        1.2.2 基因芯片的研究现状
        1.2.3 补缺算法的研究现状
    1.3 本文主要工作
    1.4 本文的组织结构
第2章 相关知识及技术
    2.1 全基因组关联分析(GWAS)
        2.1.1 基于芯片的GWAS
        2.1.2 基于高通量测序的GWAS
    2.2 DNA与SNP
    2.3 基因型和单体型
    2.4 连锁不平衡
    2.5 隐马尔可夫模型
        2.5.1 HMM的定义
        2.5.2 HMM的三个基本问题
    2.6 本章小结
第3章 利用参考数据的补缺算法
    3.1 补缺对象的确定
    3.2 补缺问题的定义
    3.3 算法的生物学依据
    3.4 建立补缺问题与隐马模型的映射
        3.4.1 对传统隐马模型的改进
        3.4.2 相应的算法的调整
    3.5 确定隐马模型参数
    3.6 计算最佳状态转移序列(路径)
    3.7 实验结果
    3.8 本章小结
第4章 无参考数据的补缺算法
    4.1 补缺问题的定义
    4.2 算法的生物学依据
    4.3 基于单体型频率的无参考补缺算法
    4.4 实验结果
    4.5 本章小结
结论
参考文献
攻读硕士学位期间发表的论文及其它成果
致谢



本文编号:3802348

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/yysx/3802348.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户eee38***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com