当前位置:主页 > 农业论文 > 园艺论文 >

白菜参考基因组升级与染色质互作分析

发布时间:2020-07-23 14:02
【摘要】:白菜属于十字花科(Cruciferae)芸薹属(Brassica),是芸薹属中第一个进行全基因组测序的作物,其基因组数据为白菜类作物的遗传改良以及芸薹属其他作物的基因组组装提供了重要参考依据。白菜参考基因组第一个版本(v1.5)于2011年组装完成,其序列长度为283.8 Mb,contig N50值为46 kb。第二个版本(v2.0)于2017年组装完成,进一步更新v2.0版本的scaffolds的连接关系,最终获得v2.5版本参考基因组,其组装序列长度为389.2 Mb,contig N50值为53 kb。由于受到测序技术的限制,两个版本(v1.5和v2.5)都存在基因组连续性差、组装错误和重复序列组装率低等问题。白菜是经历基因组多倍化的物种,其不仅经历了十字花科植物共有的全基因组复制(WGD)事件,而且在近期经历了一次芸薹属特有的全基因组三倍化(WGT)事件。真核生物的基因表达调控以及调控元件之间的相互作用需要在染色质折叠形成的三维结构中完成,染色质的折叠导致不同位置的染色质产生互作。目前有关白菜染色质互作的研究相对较少,WGT事件对白菜染色质互作的影响并不清楚。本研究利用第三代测序技术对白菜参考基因组进行组装升级,获得了高质量的白菜参考基因组v3.0版本,系统地比较了不同版本的基因组差异,并且详细地阐述了 WGT事件对白菜染色质互作的影响。主要研究结果如下:1.利用第三代测序技术(PacBio)、光学图谱技术(BioNano)和全基因组染色质构象捕获(Hi-C)等对白菜参考基因组进行从头组装和重新注释,获得了白菜参考基因组v3.0版本,其序列总长度为 353.14 Mb,contig N50 值为 1.45 Mb,scaffold N50 值为 4.45 Mb,仅含有 1,301 条scaffolds和389个gaps。本研究将白菜参考基因组的序列连续性提升近30倍,其contig N50值由46 kb(v1.5)和53 kb(v2.5)提升到1,446 kb(v3.0),并且v3.0版的gaps数量和长度远小于v2.5版和v1.5版。在v3.0中预测到45,985个编码蛋白基因,其中大部分基因(97.75%)位于染色体上,而只有极少部分(1.25%)基因位于未锚定染色体的scaffolds上。在白菜参考基因组v3.0中预测的重复序列(134 Mb)占全基因组序列的37.51%。2.通过比较三个版本的基因组注释结果,发现v3.0版的注释质量明显高于v2.5和v1.5。在v3.0中检测到2,077个串联重复基因簇,低于v2.5的3,535个串联重复基因簇。全基因组共线性分析表明,v2.5中存在的组装错误可能是导致其串联基因数量远高于其他两个版本的原因。在v3.0中预测到13,318个全长长末端重复反转座子(LTR-RTs),远高于v2.5(4,129个)和v1.5(801个)的全长LTR-RTs数量,并且在v3.0中检测到一次全新的转座子爆发事件,这些结果更新了人们之前对白菜基因组转座子扩增的认识。本研究重新构建了白菜三个亚基因组,明确了白菜基因组区段的顺序和方向,并且准确地预测白菜基因组的着丝粒和端粒位置。3.基于白菜全基因组Hi-C数据,本研究详细地分析了 WGT事件对白菜染色质互作的影响,并且比较了白菜和拟南芥的旁系同源基因间的染色质互作规律。通过高分辨率的全基因组染色质互作图谱发现白菜染色体内部的互作高于染色体之间的互作,并且白菜着丝粒之间、端粒之间的染色质互作明显。本研究检测到426对白菜旁系同源基因存在染色质互作,存在互作的比例为3.31%,其全部互作频次为1,022次,平均互作频次为2.40次。通过比较拟南芥和白菜的旁系同源基因的染色质互作,结果表明8.50%拟南芥旁系同源基因间的染色质互作在白菜基因组中保留下来,但是大部分拟南芥染色质互作在白菜基因组中已经发生丢失。综上所述,本研究利用PacBio、BioNano和Hi-C等技术获得高质量的白菜参考基因组v3.0,并且基于v3.0版的基因组进行了白菜全基因组的比较基因组学和全基因组染色质互作研究。本论文的研究成果不仅为白菜类作物的遗传改良工作奠定基础,同时也为十字花科植物的比较基因组学及染色质互作研究提供了重要的数据资源。
【学位授予单位】:中国农业大学
【学位级别】:博士
【学位授予年份】:2018
【分类号】:S634
【图文】:

三角,芸薹属作物


(Sraw/ca)是十字花科(Cruciferae)植物中最重要的一个属,其属内包括多种和饲料等作物。芸薹属作物主要由白菜、甘蓝、黑芥、芥菜、甘蓝型油菜和埃个物种构成:其中包括三个基本种,分别是白菜(Sross/ca邋rapa,AA,邋n=10)、.gra.邋BB,邋n=8)和甘蓝(Srow/ca邋o/eracea,邋CC,邋n=9),以及由这3个基本种经过个复合种,分别是芥菜AABB,邋n=18)、甘蓝型油菜(Braw/ca逡逑)和埃塞俄比亚芥(5/ms/cacflW?a/fl,BBCC,n=17)(图M)。芸薹属的六个物“禹氏三角”(U’triangle邋theory),由Nagaharu邋(1935)在总结前人的研究基础间杂交以及染色体数目等证据提出的。“禹氏三角”理论使人们首次明确了芸薹变种间的亲缘关系,极大地引导了芸薹属作物的远缘杂交工作,促进了基本种组信息交流,推进了芸薹属作物的品种选育和遗传改良工作。逡逑.邋/?即a)起源于中国,在世界各地具有悠久的栽培历史,是芸薹属的一类重要的遗传资源和广泛的形态变异,可为人们提供丰富的鲜食蔬菜、膳食纤维、维目前已公布两个版本(vl.5和v2.5)的白菜参考基因组(Wangetal.,2011;Caie个版本的白菜基因组资源为白菜类作物的遗传改良工作奠定了基础,同时也为基因组组装升级提供重要参考。但是由于受到测序技术的限制,目前两个版本(菜参考基因组存在基因组连续性差、组装错误和重复序列组装率低等问题。逡逑

流程图,基因组,流程,锚定


的reads长度,最后生成纠错后的reads;第二步是打断步骤。Canu软件会对原始reads中不被支逡逑持的区域进行打断,以得到最大的支持长度;第三步是组装步骤。Canu软件识别测序错误,然逡逑后构建最优的重叠关系图,最后输出最终的contigs邋(图1-5)。研究表明,Canu软件组装效果要逡逑优于Falcon软件,即在相同组装错误率的前提下,Canu软件组装基因组占用计算机内存更小;逡逑在相同基因组大小的前提下,Canu软件组装的基因组的错误率更低(Koren邋et邋al.,邋2017)。逡逑1.1.3染色体锚定方法逡逑染色体序列重建是基因组组装非常重要的工作,是指将scaffolds锚定到染色体上,得到完整逡逑染色体序列的过程。目前,常用的染色体锚定方法有基于物理图谱或者遗传图谱等传统方法和基逡逑于光学图谱技术或者染色质构象捕获技术等新的锚定方法。逡逑(1)传统的锚定方法逡逑传统的染色体锚定方法有基于物理图谱和遗传图谱的两种方式,前者主要是通过序列的重叠逡逑关系来确定scaffolds在染色体上的位置信息,后者主要是利用减数分裂时期的姐妹染色单体联会逡逑后的重组率来判断scaffolds在染色体的排序和方向。在实际操作过程中,传统的锚定方法存在实逡逑验难度大、成本高和实验误差大等问题。逡逑5逡逑

示意图,示意图,互作,染色质


释环境中进行平末端填平反应,以促进交联的染色质片段之间的连接;随后使用超声波对捕获的逡逑DNA片段进厅打断处理,最后将被生物素标记的DNA片段通过Illumina平台进行测序,得到全逡逑基因组染色质互作矩阵(Lieberman-Aidenetal.,2009)(图1-7)。将得到的DNA序列比对到参考逡逑基因组上,如果一对序列对应于不同位置的酶切片段,那么就认为这两个片段之间有一次染色质逡逑互作,从而能够构建基因组中所有酶切片段之间互作频率矩阵。逡逑7逡逑

【相似文献】

相关期刊论文 前10条

1 ;首个家山羊的高质量参考基因组[J];吉林畜牧兽医;2013年01期

2 ;我国成功获得高质量橡胶树参考基因组[J];生物学教学;2016年11期

3 宋述慧;滕徐菲;肖景发;;中国人群参考基因组及基因组变异图谱资源库[J];遗传;2018年11期

4 田洋;曾严;张静;杨承光;严亮;王宣军;史崇颖;谢静;戴天me;彭磊;曾寰宇;徐安妮;黄业伟;张佳进;马啸;董扬;郝淑美;盛军;;辣木(Moringa oleifera Lam.)的高质量参考基因组[J];中国科学:生命科学;2015年05期

5 武思文;;基于参考基因的转录本组装与评价[J];中国高新区;2017年22期

6 ;前沿科技[J];新疆农垦科技;2016年06期

7 英泰;;世界健康科技新亮点[J];决策与信息;2007年03期

8 ;我国天然橡胶理论研究取得重大突破[J];特种橡胶制品;2016年04期

9 莫俊銮;梁雄顺;周继昌;张丽君;龚春梅;朱玉梅;杨慧;;硒干预和DNCB致敏实验小鼠的基因表达分析参考基因的筛选[J];中国热带医学;2016年09期

10 ;信息动态[J];生物医学工程与临床;2008年01期

相关会议论文 前7条

1 刘贵明;;农作物参考基因组的组装和基于高通量测序的表观调控技术及应用[A];“农业健康与环境”组学大数据整合生物信息学研讨会论文集[C];2017年

2 刘宏高;胡继红;潘磊;黄兴国;余金洪;丁毅;;一种鲁棒有序的mRNA差异显示方法[A];基因开启未来:新时代的遗传学与科技进步——湖北省遗传学会第八次代表大会暨学术讨论会论文摘要汇编[C];2009年

3 武方琨;魏育明;刘亚西;郑有良;;缺磷条件下人工合成六倍体小麦根系直径的基因定位及分析[A];第八届全国小麦基因组学及分子育种大会摘要集[C];2017年

4 王冬至;余慷;孙林鹤;武文瑛;申莉莎;金迪;王焕雪;阳文龙;孙家柱;张爱民;刘冬成;;小麦芒长抑制基因B1的精细定位[A];2017年中国作物学会学术年会摘要集[C];2017年

5 张立武;;基于染色体级别参考基因组和重测序的黄麻重要性状GWAS分析[A];2018全国植物生物学大会论文集[C];2018年

6 王冬至;余慷;孙林鹤;武文瑛;申莉莎;金迪;王焕雪;阳文龙;孙家柱;张爱民;刘冬成;;小麦芒长抑制基因B1的精细定位[A];第八届全国小麦基因组学及分子育种大会摘要集[C];2017年

7 姜莺颖;董亚萍;杨宗英;吕新美;杨先乐;胡鲲;;连翘处理对嗜水气单胞菌耐恩诺沙星菌株的转录组影响分析[A];2017年中国水产学会学术年会论文摘要集[C];2017年

相关重要报纸文章 前9条

1 记者 赵汉斌;高质量参考基因组揭示菟丝子寄生习性演化[N];科技日报;2018年

2 记者 江东洲;高质量橡胶树参考基因组成功获得[N];科技日报;2016年

3 记者 路平;可为疾病研究提供精准参考基因组[N];广东科技报;2016年

4 记者 马芳;人类首获自身参考基因组数据集合[N];南方日报;2010年

5 记者 白毅;人类肠道微生物最高质量参考基因集数据库问世[N];中国医药报;2014年

6 记者 赖红英 刘慧婵 通讯员 卢庆雷;华南理工为尖子生量身定制培养方案[N];中国教育报;2010年

7 记者 谭大跃 第五燕燕;《自然》封面解析“人体肠道菌群元基因组研究”[N];深圳特区报;2010年

8 言实;誓为人先日本抢研基因药[N];医药经济报;2000年

9 张田勘;“中国基因歧视第一案”提出的严峻挑战[N];健康报;2010年

相关博士学位论文 前10条

1 张磊;白菜参考基因组升级与染色质互作分析[D];中国农业大学;2018年

2 易会广;无参考基因组的比较基因组学研究[D];复旦大学;2013年

3 王丛茂;高通量基因组数据的处理、分析与建模[D];上海交通大学;2012年

4 陈庚;整合多层次数据多方位解析和注释人类转录组[D];华东师范大学;2014年

5 SAMMINA MAHMOOD;[D];华中农业大学;2016年

6 李怀珠;小麦籽粒发育形态建成时期转录组学研究[D];西北农林科技大学;2014年

7 Daoura Gaoh Goudia Bachir;普通小麦(Triticum aestivum L.)及谷子(Setaria italica L.)C_4光合途径关键酶基因的表达模式分析[D];西北农林科技大学;2017年

8 林燕;大白菜小孢子早期胚胎发生相关基因的表达分析[D];中国农业大学;2014年

9 陈鑫;转录组数据的共表达分析和扩展应用[D];吉林大学;2016年

10 吴添文;五指山近交系小型猪骨髓和脐带间充质干细胞的全基因组甲基化和转录组联合分析[D];中国农业科学院;2014年

相关硕士学位论文 前10条

1 刘芳;RNA-Seq Reads mapping中基于Spark的并行FM-Index算法研究[D];内蒙古师范大学;2018年

2 廖青;猪瘟弱毒疫苗在兔脾脏内的非细胞裂解清除机制研究[D];湖南农业大学;2017年

3 鲁娜;嵌合体序列识别与热点选择偏好研究及其在单倍型分析中的应用探究[D];东南大学;2017年

4 张义军;参考基因压缩库间快速迁移算法研究[D];深圳大学;2017年

5 张永朋;高通量DNA测序数据无损压缩研究[D];深圳大学;2015年

6 张雪莹;小麦近等基因系白粉病抗性反应的转录组分析[D];山东农业大学;2015年

7 谭云涛;运用RAD(Restriction Site Associated DNA)技术构建烟草高密度连锁图谱[D];昆明理工大学;2016年

8 卢山;高通量转录组测序片段快速比对算法研究[D];哈尔滨工业大学;2015年

9 陈超;基于RNA-Seq技术的人转录组分析研究[D];中南大学;2011年

10 高亚男;小麦芒长近等基因系的遗传分析与转录组研究[D];山东农业大学;2015年



本文编号:2767419

资料下载
论文发表

本文链接:https://www.wllwen.com/nykjlw/yylw/2767419.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户24629***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com