当前位置:主页 > 医学论文 > 内分泌论文 >

关于遗传性疾病和性状相关联的单核苷酸多态性特征研究

发布时间:2020-10-10 00:36
   单核苷酸多态性(Single Nucleotide Polymorphisms,SNPs)是在染色体基因组上的单个核苷酸引起的DNA序列多态性。开展SNP关联研究对于定位致病基因、发现复杂疾病的遗传机理有着非常重要的意义。面对具有高维小样本特性的SNP数据,本文建立了致病位点的检测模型,遗传疾病与性状与位点的关联分析模型,针对海量数据进行有效降维,充分考虑SNP之间、SNP与遗传疾病之间、SNP与性状之间的强关联关系。本文主要做了如下工作:1)采用了分型值的思想,建立简单数值编码。基于等位基因频率的映射规则,对每个位点的碱基对进行重新编码,将每个位点的基因型映射为数字0,1,2。然后利用最小等位基因和哈迪-温伯格平衡建立质量控制模型,消除不符合基因平衡的因素,筛选出不符合基因平衡的SNP位点。2)对单个位点进行关联性测试。使用卡方检验和逻辑回归两种方法来探讨致病SNP的筛选。分别通过这两种方法,筛选出了致病显著性较高的十个SNP位点,并通过Bonferroni校正法控制假阳性结果。考虑到SNP之间的相关性,本文还使用随机森林算法来分析遗传数据集。随机森林算法不仅可以进行分类和回归,本文利用其重要特性之一,变量重要性来计算每个SNP的得分,得分越高表示该位点与疾病的相关程度越高,是致病SNP的可能性越大。最终得到的致病位点编号为rs2273298。3)探讨了 SNP与多个性状之间的关系。首先计算这些性状之间的相关系数,大部分都超过0.7,因此这些性状之间是高度相关的。随后,本文应用了典型相关分析,找到与这些性状高度相关的位点编号是rs12746773。
【学位单位】:厦门大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:R596
【部分图文】:

统计方法


图1.1常见G邋WAS统计方法逡逑GWAS成功地鉴定了导致复杂遗传疾病的常见单核苷酸多态性[3]。因此,逡逑GWAS支持常见疾病和普通变异假说,即常见的SNPs导致了大部分的疾病。然逡逑而,只有一部分从双胞胎,收养和家庭研究中估计的遗传性可以通过全基因组关逡逑联研究中确定的基因簇来解释。尽管遗传力估计的有效性和准确性都值得怀疑,逡逑人们普遍认为仍然存在遗传性的缺失。这一假设如果属实,则表明其他遗传机制,逡逑例如基因-基因相互作用,表观遗传学和罕见变异都会导致疾病易感性。事实上,逡逑尽管对这些因素的探索才刚刚开始,但越来越多的证据表明基因-基因相互作用逡逑和表观遗传学都会导致疾病易感性。逡逑GWAS受控于很多条件。首先,研宄人群的特征必须能够选择可能共有遗传逡逑病因的患者。其次,如果一项研究需要足够的统计力量来确定感兴趣的等位基因,逡逑并且一些相关统计策略仍在开发中,则可能需要数千个或者更多的病例组和对照逡逑

遗传数据,离散数,低维,编码方式


图2.1编码前的遗传数据逡逑

遗传数据,离散数,低维,编码方式


图2.2编码后的遗传数据逡逑

【参考文献】

相关期刊论文 前1条

1 严卫丽;;复杂疾病全基因组关联研究进展——遗传统计分析[J];遗传;2008年05期

相关硕士学位论文 前1条

1 陆清;一种新的筛选复杂性状相关基因的方法[D];中南大学;2014年



本文编号:2834456

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/nfm/2834456.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ddf76***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com