当前位置:主页 > 农业论文 > 园艺论文 >

森林草莓可变剪切基因挖掘与基因组重注释研究

发布时间:2020-10-23 19:07
   栽培草莓(Fragaria xananassa)属于多年生草本植物,因果实营养丰富,色泽鲜艳,深受消费者青睐。草莓果实属于假果,鲜嫩多汁的果肉来自于花托,而覆盖在花托表面的瘦果才是植物学意义上的果实。与其它蔷薇科植物如苹果和桃不同,草莓是非呼吸跃变型果实。栽培草莓是八倍体(2n=8 ×=56),来自4个不同的二倍体祖先种,因此其基因组非常复杂。二倍体森林草莓Fragaria vesca(F.vesca)是栽培草莓的祖先种之一,在北半球分布最广。森林草莓基因组(~240Mb)相对较小、植株矮小、生命周期短、能够进行高效的遗传转化,是研究栽培草莓和非呼吸跃变型果实的模式材料。本研究利用二代Illumina和三代SMRT测序技术,系统挖掘了森林草莓中的可变剪切基因,分析了草莓花与果实发育过程中可变剪切的动态变化,并对两个版本的森林草莓基因组进行了重注释,显著提升了森林草莓基因组注释的准确度和完整度。主要结果如下:1.在可变剪切分析中,三代比二代测序技术具有显著的优越性本研究采用PacBio公司的单分子实时测序技术(SMRT)及Illumina二代测序技术对森林草莓果实(花托)的可变剪切进行了系统挖掘和比较。通过SMRT鉴定到33,236个全长转录本,覆盖草莓基因组v2.0.a1中的10,957个基因。我们发现虽然SMRT的测序深度比Illumina低,但SMRT可检测到57.67%的多外显子基因发生可变剪切,而Illumina只检测到33.48%的多外显子基因发生可变剪切,说明SMRT能更有效地鉴定可变剪切。2.森林草莓可变剪切图谱的建立和果实发育过程中可变剪切的变化为了挖掘草莓果实发育过程中的可变剪切,收集先前的74个转录组数据,包括果实早期五个发育阶段的不同部分,总数据量达到19亿个读段。通过分析发现共有66.43%的多外显子基因发生可变剪切,其中内含子保留(IR)占比最高,随后分别为可变受体(AA)、可变供体(AD)和外显子跳跃(ES)。此外,还发现有2,453个基因由于可变剪切导致结构域的获得或缺失。通过挖掘果实发育过程中可变剪切的变化,发现草莓受精后的果实与受精前相比,内含子保留(IR)显著降低,而可变受体(AA)显著增加。KEGG富集分析表明IR显著降低的基因中剪切体途径基因显著富集,GO富集分析表明这些基因中一些重要的代谢基因显著富集。此外,这些富集基因在果实发育第一阶段的表达水平较高,从第二时期开始即大幅度降低,表明IR这种剪切方式可能是授粉受精后果实起始的重要调控机制。3.森林草莓V2基因组重注释在转录组数据分析中,发现森林草莓基因组注释准确性差,而且只包含了蛋白编码基因的编码序列。为了提高森林草莓基因组的注释质量,优化了基因组注释流程,结合PacBio全长转录组和RNA-seq数据,使用MAKER2,AUGUSTUS和PASA等软件进行基因组注释,同时利用Apollo进行人工校正。我们首先对森林草莓V2基因组进行重注释,新注释被命名为v2.0.a2。在新版注释中,被调整或新增的基因有13,168个,7,370个基因具有可变剪切转录本,18,641个基因的5'和/或3'端具有UTR。BUSCO值由88.9%增加到95.7%。此外,增加了 1,938个lncRNA,171 个 miRNA 和 51,714 个小 RNA 簇。4.森林草莓V4基因组重注释2018年,森林草莓V4基因组面世,因采用PacBio SMRT测序数据进行组装,其组装质量大幅度提高,与V2相比增加了 24.96Mb序列,基因数目却减少了数千个。另外,旧版森林草莓基因组均采用geneXXXXX命名基因,而V4基因组采用新的基因命名方式FvH4_XgXXXXX。为了改善新版基因组注释质量,建立了新注释v4.0.a2。在新注释中,基因数量由28,588个增加到34,007个,BUSCO评估完整度高达98.1%;调整了 8,342个现有基因的基因模型,添加了 9,029个新基因,10,176个基因能够产生可变剪切本。利用前期发表的大量转录组数据,建立所有基因在46种不同组织中的表达谱,方便读者查询。此外,鉴定了 84个已知miRNA基因和63个草莓特有miRNA基因,并预测了它们的靶基因。综上所述,我们的研究表明SMRT测序在识别可变剪切方面有非常大的优势,同时为后期对不同剪切本的功能研究提供了丰富的资源。此外,可变剪切不同类型的转变可能有助于果实形成时基因表达的快速变化。新注释在基因预测的准确性和完整性方面得到了显著改善,有利于草莓中的基因功能研究以及蔷薇科其他园艺植物的比较基因组分析。
【学位单位】:华中农业大学
【学位级别】:博士
【学位年份】:2019
【中图分类】:S668.4
【部分图文】:

原理图,测序,原理,测序技术


g-?A?AAA?A?A?關■關??V?WFtat?is?base?1??What?is?base?2??What?is?base?3???图1-1?Sanger测序与第二代测序的原理比较(Shendure?and?Ji?2008)??Fig.1-1?Comparison?of?Sanger?sequencing?with?next?generation?sequencing?(Shcndure??and?Ji?2008)??Solul测序技术由ABI公司于2007年推出的测序技术,它运用连接酶催化的反??应对DNA进行测序,替换了之前的聚合酶链式反应。Sohd测序以荧光标记的寡核??苷酸的不间断合成为基础,对DNA片段进行扩增和测序。这个测序平台的单碱基??质量最高且成本低,被广泛应用于SNP的鉴定,但由于Solui产生的读段在二代测??序中最短,因此不适用于转录组和基因组的组装。??目前使用最多的是lllumina/Solexa测序技术,因其性价比最高,所以应用最??广泛。Illumma平台使用边合成边测序技术(SBS)和3’端可逆的终止子技术应用??于测序中,能够实现平行化和自动化测序。测序过程中,往每个泳道加入四种不同??的荧光标记的核苷酸(A、T、C和G)和DNA聚合酶。在聚合酶的作用下

外显子,翻译能力,转录组,受点


或影响mRNA的稳定性或翻译能力(Reddy?et?al.,?2013)。对于多外显子的??mRNA,剪切模式包含多种方式,包括外显子跳跃(ES)、内含子保留(IR)、可变??受点(AA)和可变供点(AD)(图1-3)?(Black?2003)。大部分物种一半以上的基因都含??有多条剪切本,因此,基因的可变剪切极大地增加了整个转录组和蛋白质组的复杂??性和灵活性。??,sofonn?1?i>〇r〇nn?I?■■■■■■■?wmmmam??PrcmRNA?MB?MB?MB?W?■■■■■?Hi?BHi??lsoform2?l%ofom2??Exon?skipping?(ES)?Intron?retention?(IR)??Iwform?I??Prc-mRNA?prt-mRNA??Isofomt?2?lsoform?2??Alternative?acceptor?sites?(AA)?Alternative?donor?sites?(AD)??图1-3可变剪切的主要类型(Black?2003)??Fig.?1-3?Classification?of?alternative?splicing?(Black?2003)??8??

散点图,测序,果实,转录本


148个全长转录本和368,570个非全长转录本(表2-4)。转录本的长度密度图显??示三个明显的峰与三个文库的预期大小相一致,转录本的平均长度为2,466?bp,长??度显著大于草莓注释基因的平均长度(U87?bp)(图2-2a)。通过GMAP?(Wu?and??Watanabe?2005)将转录本比对到F.?基因组v2.0.al,发现89.2%的转录本能够??比对到13,284个已注释基因(总基因数量为33,673)。13,284个基因中有2,229个基??因上只有一条转录本(图2-2b),剩余83.22%基因含有两条以上的转录本。每个基??因的对应的转录本数量的中位数约为10;其中转录本最多的基因有3,561条转录本。??为了验证三代测序能否用于计算基因的表达量,我们用二代Illumina??Hiseq2500平台对SMRT测序相同样品进行链特异性测序,产生16G高覆盖度的读??段。通过散点图(scatterplot)来评估SMRT测序与Illumina测序之间表达水平的??相关性,最终得到它们之间的相关性(RA2)只有0.17?(图2-2c),说明SMRT测序??不适合计算基因的表达水平。不过
【相似文献】

相关期刊论文 前10条

1 叶云天;娄可飞;王熙然;刘勇强;陈清;汤浩茹;;森林草莓B-box基因家族全基因组序列鉴定与表达分析[J];分子植物育种;2016年04期

2 董静;王桂霞;钟传飞;常琳琳;孙健;张宏力;孙瑞;石琨;隗永青;张运涛;;森林草莓醇酰基转移酶基因FvAATW2功能研究[J];园艺学报;2018年01期

3 苗立祥;张豫超;杨肖芳;蒋桂华;;森林草莓全基因组WRKY转录因子基因的鉴定与分析[J];核农学报;2012年08期

4 雷家军;范雯;王善光;代汉萍;;五倍体野生草莓花粉性状及减数分裂的观察[J];沈阳农业大学学报;2009年04期

5 林莹;韩玉辉;熊思嘉;李泽斌;张欣;顾婷婷;;森林草莓组蛋白去乙酰化酶基因的鉴定和分析[J];南京农业大学学报;2017年02期

6 王静;赵密珍;王壮伟;吴伟民;钱亚明;;森林草莓精氨酸脱羧酶基因的电子克隆与序列分析[J];江苏农业学报;2011年03期

7 时翠平;牛树启;葛会波;;草莓属植物染色体核型分析(英文)[J];Agricultural Science & Technology;2011年01期

8 时翠平;牛树启;葛会波;;草莓属植物染色体核型分析[J];安徽农业科学;2011年13期

9 雷家军;杨高;代汉平;吴禄平;邓明琴;;我国的草莓野生种质资源[J];果树科学;1997年03期

10 江彤;张汉平;谢朝阳;陈静;冯明峰;;草莓镶脉病毒侵染性克隆的构建[J];植物病理学报;2016年02期


相关博士学位论文 前4条

1 王岩;PHR1-miR399-PHO2模块调控森林草莓(Fragaria vesca)磷含量的作用和机理[D];沈阳农业大学;2019年

2 李永平;森林草莓可变剪切基因挖掘与基因组重注释研究[D];华中农业大学;2019年

3 张豫超;森林草莓黄果表型形成机制研究[D];沈阳农业大学;2017年

4 翁天均;基于45S rDNA-FISH与GISH分析的草莓属(Fragaria)野生种亲缘关系与系统分类研究[D];西南大学;2011年


相关硕士学位论文 前10条

1 孙洪影;森林草莓FveD27基因分离鉴定及表达特性分析[D];沈阳农业大学;2019年

2 崔维旭;森林草莓FvPHO1;H9基因克隆与功能分析[D];沈阳农业大学;2019年

3 胡华英;森林草莓体细胞突变模式的初步研究[D];南京大学;2019年

4 林珊珊;森林草莓中ERF基因家族的鉴定和分析[D];南京农业大学;2017年

5 韩玉辉;森林草莓中组蛋白甲基化修饰酶基因的鉴定与分析[D];南京农业大学;2016年

6 骆慧枫;森林草莓花青素下降突变体RAP基因的克隆与功能解析[D];华中农业大学;2018年

7 张享享;草莓镶脉病毒移动蛋白P1和森林草莓叶绿素a/b结合蛋白LHC Ⅱ互作机制研究[D];安徽农业大学;2017年

8 左登攀;森林草莓锌指蛋白ZFP介导SVBV P6蛋白泛素化的机制研究[D];安徽农业大学;2017年

9 蒋西子;SVBV-AH侵染性克隆的构建及森林草莓RD21蛋白与SVBVP6蛋白的互作[D];安徽农业大学;2018年

10 赵晨晨;森林草莓菌根磷转运蛋白基因功能分析[D];北京农学院;2016年



本文编号:2853427

资料下载
论文发表

本文链接:https://www.wllwen.com/nykjlw/yylw/2853427.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9f7ec***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com