基于ISIS的基因模型不确定的关联分析
发布时间:2023-03-04 19:24
全基因组关联分析(GWAS)是研究人类遗传疾病的有效方法,关联分析法能够识别与复杂遗传疾病有关的基因位点。由于基因位点是超高维数据,传统的变量选择方法不再适用,本文使用ISIS筛选方法将超高维基因位点降至到高维,再使用SCAD变量选择方法对降维后的高维基因位点进行进一步筛选,最终得到相关致病基因位点。此外在遗传关联研究中,性状遗传决定因素的遗传模型并不总是可以确定的,实际上,通常不可能事先知道遗传的真实模型。遗传模型的错误指定会导致功耗降低。本文在全基因组关联分析中,考虑到遗传模型不确定的情况,在前人的研究基础之上创新地将三种基因遗传模型引入回归方程,尽量减少由遗传模型未知而造成的统计功效不稳健的表现。在该模型下,本文提出的基于ISIS筛选方法和SCAD变量选择方法的致病基因两步筛选法,分析比较出这两阶段的筛选方法能够准确地筛选出相关致病基因的位点,并且对SIS方法和ISIS方法做了筛选精度的比较。最后使用计算机模拟,模拟结果发现该方法对致病基因的筛选确实有一定的效果。
【文章页数】:28 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 引言
1.1 研究背景及意义
1.2 基因关联分析的国内外研究现状
1.3 创新点及其主要方法
1.4 文章的主要方法和结构
第二章 构造遗传模型不确定情况下的基因模型
2.1 基因模型不确定下的数据处理
2.2 基因型不确定下的多基因位点模型
第三章 样本基因模型不确定下的变量选择
3.1 基因模型不确定下的确定独立筛选
3.2 基因模型不确定下的SCAD变量选择
3.2.1 SCAD变量选择方法
第四章 模拟结果与分析
4.1 基因模型不确定下的数值模拟
4.1.1 基于特征筛选的数值模拟
4.1.2 基于SCAD变量选择下的数值模拟
4.2 模拟结果分析
第五章 总结与展望
5.1 总结
5.2 不足
5.3 展望
参考文献
致谢
本文编号:3754856
【文章页数】:28 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 引言
1.1 研究背景及意义
1.2 基因关联分析的国内外研究现状
1.3 创新点及其主要方法
1.4 文章的主要方法和结构
第二章 构造遗传模型不确定情况下的基因模型
2.1 基因模型不确定下的数据处理
2.2 基因型不确定下的多基因位点模型
第三章 样本基因模型不确定下的变量选择
3.1 基因模型不确定下的确定独立筛选
3.2 基因模型不确定下的SCAD变量选择
3.2.1 SCAD变量选择方法
第四章 模拟结果与分析
4.1 基因模型不确定下的数值模拟
4.1.1 基于特征筛选的数值模拟
4.1.2 基于SCAD变量选择下的数值模拟
4.2 模拟结果分析
第五章 总结与展望
5.1 总结
5.2 不足
5.3 展望
参考文献
致谢
本文编号:3754856
本文链接:https://www.wllwen.com/jingjilunwen/jingjiguanlilunwen/3754856.html