C1SLs小鼠群体遗传结构解析与血脂QTLs内候选基因鉴定
发布时间:2018-03-07 08:12
本文选题:中国野生小鼠 切入点:1号染色体 出处:《东华大学》2017年博士论文 论文类型:学位论文
【摘要】:小鼠与人类基因组高度同源,因此作为重要的模式动物之一,在人类复杂性状研究中扮演着重要角色。在小鼠群体中,数量性状座位(Quantitative trait locus,QTL)定位主要有连锁分析和关联分析等策略。由于近交系小鼠亚种来源单一、遗传多样性匮乏、单倍型大等特点,导致定位的QTL较大,很难快速克隆性状相关的功能基因。因此,新的小鼠资源亟待开发来克服上述困难。染色体替换系策略通过降低基因组背景复杂度,显著提高了QTL定位的灵敏度。报道显示,自然界中的野生小鼠蕴含着丰富的遗传多样性与表型多样性。由于大量历史重组事件的积累,其连锁不平衡衰减速度与人类群体相似,QTL定位可达到单基因分辨率,是复杂性状研究的理想资源。结合染色体替换和野生小鼠资源的特点,我们提出了利用“特异染色体替换小鼠群体”用于QTL定位与基因克隆的策略,同时构建了以中国野生小鼠来源为主的1号染色体替换系(chromosome 1 substitution lines,C1SLs)群体。在该群体中,每个品系的1号染色体来源不同,其余染色体都来源于C57BL/6J品系。截至目前,已顺利完成18个品系的构建与全基因组重测序工作。为了解析该群体的遗传结构并应用于血脂调控基因的鉴定,本论文主要开展了以下个四个方面的研究工作。第一,C1SLs小鼠群体遗传结构解析。与近交系小鼠相比,C1SLs小鼠群体含有丰富的遗传变异。通过对C1SLs群体测序数据的生物信息学分析,在1号染色体上鉴定了450万个单核苷酸多态性(single nucleotide polymorphism,SNP)和小片段的插入/缺失(indel)。其中130万个为新发现的遗传变异,不存在于小鼠基因组项目(Mouse Genome Project,MGP)测序的36个近交系小鼠和db SNP142遗传变异数据集中。统计结果表明,C1SLs群体的遗传变异数量是近交系小鼠的5倍之多。SNPs和indels功能注释结果显示,0.47%(21335)的突变位于蛋白编码区,共影响1002个蛋白编码基因。其中,含有大量首次发现的遗传变异,包括可能导致蛋白功能失活的3009个非同义突变、45个终止密码子增加突变、6个终止密码子缺失突变和65个移码突变。此外,通过基因功能富集分析,发现138个基因参与了60条已知的生物学通路,包括免疫相关通路和嗅觉信号转导通路等。对于大片段缺失突变(50 bp),鉴定205个基因含有605个功能性缺失。其中,3个基因与人类疾病相关(Gigyf2,Ptpn14和Cfh),7个基因参与了11条已知代谢通路,包括补体和凝血级联、药物代谢、嗅觉转导等。C1SLs小鼠遗传结构与近交系小鼠不同;单倍型大小与人类群体相似。以C1SLs小鼠和MGP测序的36个近交系小鼠1号染色体上的SNP数据为基础,通过主成分分析发现,二者在遗传结构上存在显著差异。进一步的亚种来源于与主成分析表明,C1SLs小鼠的1号染色体为“马赛克”结构,含有三个小鼠亚种序列,但各亚种序列贡献度不一。对于C57BL/6J-Chr1~(KM)品系,其亚种与近交系小鼠相似,主要来源于M.m.domesticus。对于其它17个品系,亚种主要来源为M.m.musculus和M.m.castaneus。各亚种序列贡献度与中国野生小鼠亚种地理分布相吻合,即北方以M.m.musculus为主,南方以M.m.castaneus为主。基于四配子原则的单倍型分析结果表明,在C1SLs群体中,1号染色体上最大的单倍型长度为100 kb左右,近57%的单倍型小于1 kb,只有4%(1081个)大于10 kb,说明该群体积累了大量的历史重组事件,可用于QTL的精细定位。此外,研究还发现C1SLs群体核苷酸多样性整体高于近交系小鼠。第二,近交系小鼠与野生小鼠1号染色体选择压力分析。目前认为,近交系小鼠或有意或无意的经历了几十甚至上百代的人工选择压力,而野生小鼠可能经历了更多的自然选择压力。然而,近交系小鼠和野生小鼠受到选择压力的基因组区段以及相关基因目前还未有报到,二者之间是否存不同的选择模式也需要进一步的调查研究。研究以Tajima's D和Fst两种统计学分析为手段,对C1SLs和MGP两个小鼠群体的1号染色体进行了选择压力分析。对于Tajima's D,在C1SLs群体中共鉴定149个受到选择压力的区段,序列总长为7.125 Mb;MGP群体中则发现243个选择信号,序列总长为13.27 Mb。比较发现,只有13个蛋白编码基因同时存在于C1SLs和MGP的鉴定的选择压力区段内。其中,9个基因的选择方向在两个群体中截然相反。此外,通过对候选基因功能富集分析,发现部分基因显著富集于神经管形态发生、嗅觉信号转导等生物学通路。对于Fst统计分析结果,共发现110个受到选择压力的候选区段,包含47个蛋白编码基因。其中,多数基因参与调控了行为、生长发育、体重、体长、免疫或衰老等生物学过程。这些结果表明,近交系小鼠与野生小鼠经历了不同的选择压力,受到选择压力的基因功能与两个群体间的表型差异相吻合。第三,B6-Chr1~(KM)小鼠遗传变异与结构解析。作为我国最大的远交系小鼠群体,KM小鼠在我国生物医学研究中具有重要的地位,但针对KM小鼠的遗传背景以及亚种来源时至今日仍然未被解析。在对C1SLs小鼠群体整体遗传结构解析的基础上,本部分内容主要分析了B6-Chr1~(KM)小鼠的全基因组重测序数据。其中,该品系的1号染色体来源于KM小鼠。在B6-Chr1~(KM)小鼠1号染色体上鉴定了48万个SNPs和96679个indels。其中,6.4%的SNPs和16.3%的indels为新发现的遗传突变。功能注释发现474个突变对基因功能有潜在的影响。其中,21个基因参与调控了49个人类疾病相关的表型,如黄斑变性、乳腺癌以及免疫缺陷等疾病。为了解析KM小鼠的亚种来源,我们比较了B6-Chr1~(KM)小鼠1号染色体与三个小鼠亚种序列的相似度。结果显示,B6-Chr1~(KM)小鼠与WSB(M.m.domesticus)存在较高的序列相似性,同时发现B6-Chr1~(KM)与PWK(M.m.musculus)序列相似性呈现出两个峰值,表明M.m.musculus亚种序列可能渗入到了KM小鼠的1号染色体内。此外,以500 kb为区段、100 kb步长的序列相似性分析结果表明B6-Chr1~(KM)小鼠1号染色体上有13.5%和6.4%的序列分别与PWK和CAST(M.m.castaneus)存在较高的序列相似性(99.7%)。为了进一步了解B6-Chr1~(KM) 1号染色体系统发生树的不一致性,我们对1号染色体进行了贝叶斯一致性分析。结果显示,87.7%的位点的后验概率支持KM/WSB拓扑结构;9.7%支持KM/PWK拓扑结构。结合序列相似性分析和贝叶斯一致性分析结果,最终明确了KM小鼠的基因组序列主要来源于M.m.domesticus亚种,部分序列来源于M.m.musculus亚种。第四,血脂相关QTLs内候选基因的鉴定。选取C1SLs群体中13个品系以及受体品系C57BL/6J,通过饲喂高脂诱导饲料和对照饲料,评估了总胆固醇(cholesterol,CHOL)、高密度脂蛋白胆固醇(high density lipoprotein cholesterol,HDL-C)、低密度脂蛋白胆固醇(low density lipoprotein cholesterol,LDL-C)以及甘油三酯(triglyceride,TG)在该群体中的表型多样性。结果显示,血脂水平在C1SLs小鼠和C57BL/6J之间存在显著差异。部分小鼠血脂易于诱导,而部分则诱导前后未发生显著变化,表现出较高的耐受性。通过表达差异基因分析和关联分析,鉴定部分已知血脂QTLs内的候选基因。一方面,选取对照组中3个与受体品系表型存在显著差异的C1SLs小鼠品系,与C57BL/6J小鼠肝脏转录组表达水平进行比较,在已知QTLs内鉴定42个蛋白编码基因和24个非编码RNA存在表达差异。其中,Spp1、Cd68、Cd74、Csf1r、Acacb、Aldh1a7和Akr1c19基因与已知血脂调控基因Soat1存在相互作用关系。在CHOL、HDL-C和LDL-C相关QTLs内,Gm70、Gm16432、Lyplal1、Actg-ps1和Aldh1a7在3个C1SLs小鼠品系中表达趋势一致。对于TG,一个蛋白编码基因(Acacb)和两个非编码RNA基因同时在B6-Chr1~(KM)和B6-Chr1SJ表达量降低。此外,基因型-表型关联分析结果显示,在替换系和近交系群体中分别鉴定41和69个功能性SNP与血脂性状显著相关。其中,3个基因同时存在于两个群体中,分别为与CHOL相关的Cfap126基因、与LDL-C相关的1700025G04Rik基因以及与TG相关的Rbm44基因。
[Abstract]:......
【学位授予单位】:东华大学
【学位级别】:博士
【学位授予年份】:2017
【分类号】:Q78
,
本文编号:1578610
本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/1578610.html
最近更新
教材专著