西瓜与甜瓜细胞器比较基因组学研究
发布时间:2020-06-16 10:10
【摘要】:西瓜(Citrullus lanatus L.)和甜瓜(Cucumis melo L.)均是世界性的园艺作物,具有重要的经济价值。细胞器基因组是一个物种全基因组的重要组成部分,研究西瓜、甜瓜细胞器(叶绿体和线粒体)基因组是继核基因组计划之后,解析西瓜、甜瓜全部遗传信息,进而实现西瓜、甜瓜分子设计育种的必经之路。目前有关西瓜、甜瓜细胞器基因组的研究较少,在一定程度上阻碍了西瓜、甜瓜基于细胞器基因组相关研究的开展。因此,对西瓜、甜瓜细胞器基因组研究具有重要的意义。本研究首先测序、拼接、组装并发表了栽培西瓜叶绿体基因组全序列,以及甜瓜线粒体基因组全序列,然后结合GenBank数据库中已经公布的基因组数据,对西瓜、甜瓜的细胞器基因组进行了全面的比较基因组学分析,主要研究内容和结果如下:1.完成并公布了首个栽培西瓜叶绿体基因组。栽培西瓜的叶绿体基因组由一个单环双链DNA分子构成,全长为156,906bp,呈典型的四段式结构,其中大单拷贝区(LSC)长86,844bp,小单拷贝区(SSC)长17,896bp,两个反向重复区(IRa和IRb)长均为26,083bp。整个基因组编码131个基因,其中包括86个蛋白编码基因、37个tRNA基因、8个rRNA基因;其基因组的结构、GC含量、基因排列顺序和密码子偏好性与其它高等植物的叶绿体基因组相似。此外,在西瓜的叶绿体基因组中存在19条串联重复序列(TR)、26对散在重复序列(DR)和53条简单重复序列(SSR),其中SSR类型多为多聚A和多聚T,主要分布于非编码区。2.提出了全新的基于高通量测序数据高效叶绿体基因组拼接策略。本研究提出了一套基于Illumina Hiseq全基因组测序数据从头组装叶绿体基因组的全新策略,无须单独分离纯化叶绿体基因组DNA,即可高效经济地获取植物叶绿体基因组完整序列,用该方法成功完成并首次公布了栽培西瓜叶绿体基因组,随后用该方法率先成功组装完成了药西瓜(Citrullus colocynthis)、热迷西瓜(Citrullus rehmii)、阿玛鲁西瓜(Citrullus amarus)等3个野生种西瓜,以及中国南瓜(Cucurbita moschata)、印度南瓜(Cucurbita maxima)、苦瓜(Momordica charantia)和葫芦(Lagenaria siceraria)等4个葫芦科植物的叶绿体参考基因组,再次验证该方法的良好通用性和实用性。基于15个葫芦科植物的叶绿体全基因组序列的比较基因组学分析发现,葫芦科植物的叶绿体基因组均为单环双链DNA分子,GC含量与西瓜相似,均在36.7~37.2%,全基因组长度约为155~159kb,平均长度约为157kb,编码基因数量为130~133个,平均有131个基因;叶绿体基因组之间整体的共线性比较好,没有发生重排现象。此外,我们基于15个葫芦科植物的叶绿体基因组序列的比对结果,开发了适用于葫芦科内物种鉴定、系统进化和群体遗传等相关研究的7个DNA barcoding和38个SSR标记,用叶绿体全基因组序列进行系统进化关系分析,可以得到与核基因组分析相似的结果。3.完成并公布了首个甜瓜线粒体全基因组完整序列。本研究利用具有读长优势的三代测序技术PacBio Sequel测序数据用于甜瓜线粒体基因组研究,成功完成并公布了葫芦科植物中序列最长的甜瓜线粒体基因组完整序列,该基因组由3个环状的DNA分子组成,主环长度为2,709,526bp,其余两个小环,长度分别为149,555bp和47,592bp,基因组总长约为2.9Mb(2,906,673bp),GC含量为44.77%,高于甜瓜细胞核基因组和叶绿体基因组的GC的含量。该基因组编码了88个基因,包含40个蛋白编码基因,8个rRNA基因和40个tRNA基因,其中所有蛋白编码基因全部分布于主环上,仅有5个tRNA基因分布于第二个小环上,第三个小环上没有任何编码基因。非编码基因序列占甜瓜线粒体基因组的绝大部分,其百分比值为98.32%。甜瓜线粒体基因组序列与叶绿体和细胞核基因组同源序列分别为2.73%和46.47%。此外,甜瓜线粒体基因组中共有4,861对同向重复序列,439对反向重复序列,653条串联重复序列,以及218条SSR序列,重复序列的总长度约占全基因组的44.2%。对甜瓜、西瓜、黄瓜和西葫芦的线粒体基因结构特征进行深入比较分析后发现,大量的重复序列和核基因组源序列是甜瓜线粒体基因组规模不断增大和变异的主要原因,此发现为葫芦科植物线粒体基因组的遗传变异提供依据。4.将叶绿体全基因组首次应用于西瓜、甜瓜的群体结构及遗传多样性的研究。本研究分别在314份西瓜材料的西瓜自然群体和348份甜瓜材料的甜瓜自然群体内鉴别了的82个和192个叶绿体基因组SNP位点,主要分布在叶绿体基因组的LSC区和SSC区内,互为反向重复的IRa和IRb中几乎不含有SNP位点。然后用这些SNP位点分析了西瓜、甜瓜自然群体的群体结构,并对每个群体的果实相关性状和群体遗传多样性进行深入分析,结果表明82个SNP能有效地将西瓜自然群体分为4个群体:野生毛西瓜群、半野生黏籽西瓜群、美洲生态型栽培西瓜群和亚洲生态型栽培西瓜群,其遗传多样性(π值)依次下降,分别为6.6×10~(-5),2.4×10~(-5),9.8×10~(-6)和5.41×10~(-6),野生毛西瓜群的单果重、可溶性固形物、果肉颜色和种子千粒重与其它三个群有显著的差异。192个SNP能有效地将甜瓜自然群体分为3个群体:野生小甜瓜群、厚皮型栽培甜瓜群和薄皮型栽培甜瓜群,其遗传多样性也依次下降,分别为1.12×10~(-3)、4.71×10~(-4)和2.85×10~(-4),三个群体之间的果肉厚度有显著差异。这些研究结果表明叶绿体全基因组可用于西瓜和甜瓜的群体遗传学研究,有助于种内亚群之间的分类和核心种质资源鉴定等研究。本研究发表的首个栽培西瓜叶绿体参考基因组及首个甜瓜线粒体参考基因组,所构建的叶绿体基因组从头拼接全新策略及开发的适用于葫芦科植物研究的DNA barcoding和SSR分子标记,将为今后西瓜、甜瓜系统进化、物种鉴定、群体遗传、核质互作、RNA编辑、基因工程等基于叶绿体和线粒体基因组的相关研究提供理论依据。
【学位授予单位】:东北农业大学
【学位级别】:博士
【学位授予年份】:2018
【分类号】:S651;S652
【图文】:
注:紫色进化树代表真核细胞由古细菌起源的过程,深红色进化树代表线粒体由古变形菌起源的过程,蓝色进化树代表叶绿体由古蓝藻细菌起源的过程。图 1-1 叶绿体和线粒体的内共生进化起源过程,此图引自 Timmis 等人[7]Figure 1-1 The endosymbiotic evolution of chloroplast and mitochondria, the figure cited Timmiset al[7]1.1.3 叶绿体基因组结构及特点高等植物叶绿体基因组的大小一般在 115~165kb 之间,且结构非常保守。烟草的叶绿体基因组是高等植物中第一个被测序完成的叶绿体基因组[9],其基因组结构为单环双链状 DNA分子,具有典型的四段式结构,分别为一个大单拷贝区(Large single copy,LSC),一个小单拷贝区(Small single copy,SSC)和两个互为反向重复的重复区(Inverted repeat region,IRa 和 IRb),大多数植物叶绿体基因组中的 LSC 区的长度约为 81~90kb,SSC 区长度介于18~20kb 之间,IR 区长度变化最大则介于 5~76kb 之间[10],LSC 和 SSC 被两个 IR 序列分隔开。在被子植物的进化过程中,叶绿体基因组中这四部分的顺序几乎保持不变。叶绿体基因组大小的变异在进化过程中主要受到 IR 区的延展或缩小或丢失及基因间区长度的影响,如豌豆、日本柳杉的 IR 区完全消失[11];日本黑松的 IR 区序列已经缩减至 495bp;相比之下,天竺葵的 IR 区却急剧增加了 76kb[12]。这些研究表明在叶绿体基因组中 IR 区可能对于植物的生长发
表 3-1 不同测序数据量的叶绿体基因组从头组装结果Table 3-1 The results of de novo chloroplast genome based on different sequence data size特征Features数据量Data size0.1× 0.2× 0.3× 0.4× 0.5× 0.6× 0.7× 0.8× 0.9× 1.0×MSL (bp) 86,852 86,852131,15386,85286,852113,077131,15368,78961,49834,928ASL (bp) 24,998 15,229 16,49622,37625,07629,702 22,70016,56616,8506,738N50L (bp) 86,852 86,852131,15386,85286,852113,077131,15341,65037,06913,846TOL 6 11 12 7 6 5 7 9 15 82CVG 54 54 65 54 54 66 65 54 68 1注:MSL:Max sequence length,最长序列长度;ASL:Average sequence length,平均序列长度,N50L:N50 length,N50 长度;TOS:Total sequences,总序列数,CVG:Coverage,覆盖度。
本文编号:2715907
【学位授予单位】:东北农业大学
【学位级别】:博士
【学位授予年份】:2018
【分类号】:S651;S652
【图文】:
注:紫色进化树代表真核细胞由古细菌起源的过程,深红色进化树代表线粒体由古变形菌起源的过程,蓝色进化树代表叶绿体由古蓝藻细菌起源的过程。图 1-1 叶绿体和线粒体的内共生进化起源过程,此图引自 Timmis 等人[7]Figure 1-1 The endosymbiotic evolution of chloroplast and mitochondria, the figure cited Timmiset al[7]1.1.3 叶绿体基因组结构及特点高等植物叶绿体基因组的大小一般在 115~165kb 之间,且结构非常保守。烟草的叶绿体基因组是高等植物中第一个被测序完成的叶绿体基因组[9],其基因组结构为单环双链状 DNA分子,具有典型的四段式结构,分别为一个大单拷贝区(Large single copy,LSC),一个小单拷贝区(Small single copy,SSC)和两个互为反向重复的重复区(Inverted repeat region,IRa 和 IRb),大多数植物叶绿体基因组中的 LSC 区的长度约为 81~90kb,SSC 区长度介于18~20kb 之间,IR 区长度变化最大则介于 5~76kb 之间[10],LSC 和 SSC 被两个 IR 序列分隔开。在被子植物的进化过程中,叶绿体基因组中这四部分的顺序几乎保持不变。叶绿体基因组大小的变异在进化过程中主要受到 IR 区的延展或缩小或丢失及基因间区长度的影响,如豌豆、日本柳杉的 IR 区完全消失[11];日本黑松的 IR 区序列已经缩减至 495bp;相比之下,天竺葵的 IR 区却急剧增加了 76kb[12]。这些研究表明在叶绿体基因组中 IR 区可能对于植物的生长发
表 3-1 不同测序数据量的叶绿体基因组从头组装结果Table 3-1 The results of de novo chloroplast genome based on different sequence data size特征Features数据量Data size0.1× 0.2× 0.3× 0.4× 0.5× 0.6× 0.7× 0.8× 0.9× 1.0×MSL (bp) 86,852 86,852131,15386,85286,852113,077131,15368,78961,49834,928ASL (bp) 24,998 15,229 16,49622,37625,07629,702 22,70016,56616,8506,738N50L (bp) 86,852 86,852131,15386,85286,852113,077131,15341,65037,06913,846TOL 6 11 12 7 6 5 7 9 15 82CVG 54 54 65 54 54 66 65 54 68 1注:MSL:Max sequence length,最长序列长度;ASL:Average sequence length,平均序列长度,N50L:N50 length,N50 长度;TOS:Total sequences,总序列数,CVG:Coverage,覆盖度。
【参考文献】
相关期刊论文 前4条
1 李峰;管敏鑫;;线粒体起源和蛋白含量进化[J];科技通报;2015年01期
2 崔柳青;李一帆;潘卫东;;叶绿体基因工程研究进展[J];生物技术通报;2012年06期
3 李双双;薛龙飞;苏爱国;雷彬彬;王玉美;华金平;;高等植物线粒体基因组测序和序列分析[J];中国农业大学学报;2011年02期
4 王鸣;侯沛;;西瓜的起源、历史、分类及育种成就[J];当代蔬菜;2006年03期
本文编号:2715907
本文链接:https://www.wllwen.com/nykjlw/yylw/2715907.html