当前位置:主页 > 理工论文 > 生物学论文 >

单倍型Hi-C软件的开发与应用

发布时间:2020-07-12 04:37
【摘要】:基于染色体构象捕获技术及其衍生技术(如Hi-C)的研究表明,染色质高阶结构在转录调控、DNA复制、早期胚胎发育以及疾病发生等过程中发挥着重要的作用。近年来,人们利用已定相遗传变异来区分二倍体细胞中同源染色体的高阶结构,发现父本染色质高阶结构和母本染色质高阶结构在特定区间或者特定发育阶段存在着显著差异,即染色质高阶结构具有等位效应,并且染色质高阶结构等位效应在调控等位特异性基因表达方面可能起着重要作用。本文将这种使用已定相遗传变异把Hi-C数据区分为父本和母本染色质互作的研究简称为单倍型Hi-C(haplotype-resolved Hi-C)。然而,由于遗传变异数量有限且分布不均衡,单倍型Hi-C的数据利用率较低并且数据偏好很强,因此优化单倍型Hi-C数据处理和结构识别对于提高单倍型染色质高阶结构识别的精度和准确性具有重要意义。本文开发了一种新型单倍型Hi-C软件HiCHap,主要功能包括利用Hi-C读段的所有序列信息来提高单倍型数据利用率,使用两步校正策略分别校正遗传变异分布密度不均衡和Hi-C实验引起的单倍型数据偏好,使用新的识别方法得到单倍型染色质高阶结构。最后本文使用HiCHap软件初步研究了染色质环等位特异性与关键转录因子等位效应之间的关联。首先,HiCHap软件利用了Hi-C读段上所有序列的杂合单核苷酸多态性(SNP)来提高数据利用率。传统Hi-C序列比对通常使用了切割连接位点或迭代切割方法,这个过程中丢弃了部分序列,本文对切割连接位点后的所有序列都进行序列比对,充分利用Hi-C读段上所有序列的杂合SNPs来提高单倍型Hi-C的数据利用率。其次,HiCHap软件使用两步校正策略分别校正了SNP分布密度不均衡和Hi-C实验引起的单倍型数据偏好,并构建了单倍型染色质互作矩阵。由于遗传变异分布密度与单倍型数据利用率之间的关系复杂,HiCHap直接使用该区间单倍型数据利用率来间接衡量遗传变异分布密度的影响,并结合非对称阵策略来对遗传变异分布密度不均衡引起的单倍型Hi-C数据偏好进行第一步校正。接着,将第一步校正后的非对称阵对称化,并使用矩阵平衡算法消除Hi-C实验引起的数据噪声,进行第二步数据偏好校正。经过与传统方法比较,本文校正算法在多个评价指标上都表现良好。再次,以染色质环为例,本文通过调整传统算法识别了单倍型染色质环,并在整合单倍型染色质环和传统非单倍型染色质环的基础上使用二项分布检验了父本染色质环和母本染色质环的差异显著性,识别和筛选等位特异性染色质环。最后,本文使用HiCHap软件分析了等位特异性染色质环与关键转录因子(如CTCF和Cohesin)结合位点等位效应之间的关联,发现等位特异性染色质环上往往也存在着等位特异性转录因子结合位点,并且染色质环等位效应与转录因子的等位效应呈现出一定程度的正相关性,暗示着关键转录因子结合位点的等位效应可能是引起等位特异性染色质环的重要原因之一。
【学位授予单位】:华中农业大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:Q811.4;TP311.52
【图文】:

技术原理


图 1.1 Hi-C 技术原理图 (Lieberman-Aiden et al 2009)Fig. 1.1 Principle and technology pipeline of Hi-C.(Lieberman-Aiden et al 2009)二代测序技术的兴起,基因组学研究走向了高通量时代,染色体构象捕获技术也获得了长足发展。2009 年,Liberman-Aiden 等人和 Fullwood 等人分别开发了 Hi-C(Liberman-Aiden et al 2009)和 ChIA-PET(Fullwood et al 2009)技术,旨在使用高通量测序捕获全基因组范围内的染色质互作。以 Hi-C 技术为例(如图 1.1),该技术试图捕获全基因组范围内所有染色质互作,其主要实验流程为:首先利用甲醛将染色质互作进行交联,然后利用限制性内切酶将染色质切成短片段,并利用有生物素标记的核苷酸将限制性酶切片段末端补平,接着在 DNA 浓度较低的环境中将交联的 DNA 片段连接起来,然后将连接产物用超声波打断、生物素标记并且纯化,最后利用双端测序来测定互作片段。在 Hi-C 实验流程基础上,Rao 等人于 2014 年开发了原位 Hi-C(in situ Hi-C)技术,进一步捕获了

染色质结构,拓扑,互作,结构域


3图 1.2 染色质结构的层次化(Bonev and Cavalli 2016)A)图展示了一个从高分辨率 Hi-C 数据观察到的染色质环(loop)和 CTCF 的结合情况以及 motif 的。(B)左图接近 8Mb 区域包含了数个拓扑关联结构域(TADs),右图展示了三种不同的拓扑关联结构意图;(C)不同拓扑关联结构域都具有内部结构域强互作的特点,并一起组成区室;(D)左图是以热形式对染色质之间互作的一种展示,右图展示了染色质疆域。Fig. 1.2 Hierarchical organization of chromatin structure (Bonev and Cavalli 2016)A) The figure is an example of an architectural loop as seen in high-resolution Hi C data, as well as CCCTinding factor (CTCF)-binding profile and CTCF motif orientation. (B) The left figure is an approximately 8 egion containing several topologically associating domains (TADs) as seen in the heat map. three different TAre shown on the right.(C) Different topological domains are characterized by stronger inter-domain interactions are organized into compartments.(D) Interaction matrix of the inter-chromosome is shown as heatmap on the lhromatin territory is shown on the right.

变化过程图,单倍型,染色质结构,变化过程


通过模式小鼠进行杂交,研究者们使用 Hi-C 技术研究了早期胚胎发育过程(Du et al 2017, Ke et al 2017)。通过单倍型染色质高阶结构分析,揭示了哺乳动物受精前后父本和母本染色质高阶结构在早期发育过程中的变化。如图1.3所示,研究者发现在精子和卵子结合之前,精细胞保留了拓扑关联结构域和区室等染色质高阶结构。相反,卵细胞染色质丢失了这些结构。受精后,尽管精子和卵子已经融合,但父本和母本单倍型染色质在染色质高阶结构上仍然存在差异。这种差异一直从受精开始后延续到 8 细胞时期(Du et al 2017)。图 1.3 小鼠胚胎细胞发育早期单倍型染色质结构变化过程(Du et al 2017)Fig. 1.3 The changes in haplotype chromatin structure during early development of mouseembryonic cell (Du et al 2017)随着研究深入,研究者们发现等位基因特异性表达和单倍型染色质高阶结构同样有着密切关系,如图 1.4 所示,在人类第 11 号染色体上存在着两个印记基因 IGF2 和 H19

【相似文献】

相关期刊论文 前10条

1 孙逸平;安家宾;戴澄清;江载芳;李驰;王忠仁;;结核病的发病与白细胞抗原单倍型关联[J];中日友好医院学报;1988年03期

2 李双双;张迎新;范成明;陈宇红;邓传良;胡赞民;;单倍型分析技术研究进展[J];生物工程学报;2018年06期

3 刘平;任维宾;杨瑛;陈晓鸣;杨子祥;;角倍蚜细胞色素氧化酶(CO Ⅰ)基因的多样性分析[J];生物资源;2018年01期

4 郭茂东;王群英;陈燕萍;滕卫军;马拥军;杨小云;韦炜;丁进;;IL-12B基因多态性及单倍型与克罗恩病的关系研究[J];浙江医学;2018年09期

5 宣泽义;曹艳红;吴柱月;黄明光;陈少梅;王凯悦;陈宏;雷初朝;;南宁市肉牛的Y染色体遗传多样性分析[J];中国牛业科学;2019年03期

6 张森;李辉;;单倍型在QTL检测中的应用研究[J];中国农业科学;2007年04期

7 夏小婷;邹勇;党瑞华;黄永震;蓝贤勇;陈宏;雷初朝;;关岭牛Y染色体遗传多样性与父系起源研究[J];中国牛业科学;2017年06期

8 薛敏;潘芹芹;缪扣荣;周小玉;赵星;樊u&;唐燕;汪承亚;;127个家系的HLA-A、B、DR单倍型分析[J];中国输血杂志;2006年01期

9 袁宝军,颉玉欣,邹吉敏,安新,李伟,张志欣;2型糖尿病家系人类白细胞抗原DRB1~*和DQB1~*单倍型分析[J];中华老年多器官疾病杂志;2004年03期

10 钱恩芳;吴文静;王磊;王小娟;刘杨;马泉;赵慧;李彩霞;黄江;江丽;;Y-STRs和Y-SNPs综合分析方法在父系家系调查中的应用[J];南京医科大学学报(自然科学版);2019年08期

相关会议论文 前5条

1 周在威;颜景斌;李华;任兆瑞;;利用高分辨率熔点曲线技术对牛线粒体DNA进行单倍型分析[A];遗传学与社会可持续发展——2010中国青年遗传学家论坛论文摘要汇编[C];2010年

2 李佳丽;陈阳;刘明;陈秋燃;周娟;吴信生;;MLPH基因多态性位点与獭兔毛色的关联性分析[A];中国畜牧兽医学会养兔学分会第二届学术交流大会论文集[C];2018年

3 孟新展;王沈同;张猛;党云飞;李立森;黄文吉;方圆;王丰;沈玉帮;李家乐;;草鱼野生与选育群体线粒体DNA控制区(D-loop)遗传变异分析[A];2018年中国水产学会学术年会论文摘要集[C];2018年

4 陈兴;王超;王益;周永红;;四倍体小麦NRAMP2、3、5和6转运蛋白的单倍型分析[A];第十届全国小麦基因组学及分子育种大会摘要集[C];2019年

5 李艳华;赵兴波;王小花;李宁;吴常信;;猪UCP3基因多态的发现与单倍型分析[A];第十次全国畜禽遗传标记研讨会论文集[C];2006年

相关博士学位论文 前9条

1 王雅美;小麦胚乳ADP-葡萄糖转运蛋白编码基因TaBT1的遗传效应和育种选择研究[D];中国农业科学院;2018年

2 史素琴;LGR4基因多态性和单倍型与女性峰值骨密度及肥胖表型核心家系的关联分析[D];郑州大学;2018年

3 钱亚屏;中国云南5个民族的遗传多样性研究[D];中国协和医科大学;1999年

4 朱文圣;基因型常有误差时单倍型分析的统计方法[D];东北师范大学;2006年

5 于扬;染色体5q31区Graves病易感基因的研究和中国汉族人单倍型域的构建[D];中国医科大学;2007年

6 苗丽丽;小麦蛋白激酶基因TaSnRK2.3/4单核苷酸多态性及其与农艺性状的关联分析[D];东北农业大学;2017年

7 樊庆灿;京海黄鸡部分重要经济性状的全基因组关联分析研究[D];扬州大学;2014年

8 林衡;玉米重要农艺性状和抗病性状的全基因组关联分析[D];中国农业科学院;2015年

9 张杰;杜洛克×二花脸F_2资源群体免疫相关性状全基因组关联分析及候选基因功能初步研究[D];华中农业大学;2017年

相关硕士学位论文 前10条

1 罗瀚;单倍型Hi-C软件的开发与应用[D];华中农业大学;2019年

2 吴亚江;线粒体基因组揭示中国家鸡的母系历史[D];云南大学;2018年

3 周晶;法医个体识别微单倍型标记的筛选及NGS检测体系的建立[D];河北医科大学;2019年

4 李致伟;基于选择信号和关联分析鉴定温带和热带玉米中优势单倍型和关联基因[D];中国农业科学院;2019年

5 郑洁;通过靶向捕获测序和HaCaT细胞实验鉴定与AD相关的TMEM232基因[D];安徽医科大学;2019年

6 王柳;引物限制合成测序分析PCR产物单倍型的研究[D];东南大学;2018年

7 潘荣芳;不同步合成焦测序分析单倍型的研究[D];东南大学;2017年

8 陈翠敏;应用微卫星多态位点对X连锁型视网膜色素变性疾病进行遗传连锁分析的研究[D];第三军医大学;2006年

9 高敏;全基因组扫描定位遗传性对称性色素异常症易感区域[D];安徽医科大学;2003年

10 黄毅;鹅黑素皮质素受体-4基因(MC4R)单核苷酸多态性分析与生产性状相关研究[D];四川农业大学;2009年



本文编号:2751430

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/swxlw/2751430.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户cd35f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com