当前位置:主页 > 理工论文 > 生物学论文 >

基于三代转录组测序的植物全长转录本数据库构建及水稻杂种数据分型

发布时间:2021-10-30 11:55
  三代转录组测序Iso-Seq(Isoform Sequencing)是近些年来新兴的转录组测序方式,其相对于二代测序技术最大优势是读段长,可以在不组装的前提下表征整个转录组。本研究基于三代转录组测序Iso-Seq完成了两项工作,一项是构建一个植物全长转录本数据库,另一项是结合其他组学测序数据对水稻杂种测序数据进行分型。主要研究内容如下:1.构建植物全长转录本数据库PISO(Plant ISOform sequencing database)本课题共收集了19种植物的Iso-Seq数据,以建立植物全长转录本数据库。考虑到参考基因组和倍性的存在,对19个物种使用了三套流程完成了转录本识别,新基因发现、可变剪切(Alternative Splicing,AS)事件识别和选择性多聚腺苷化(Alternative Polyadenylation,APA)事件识别。基于处理后的这些数据,构建了植物全长转录本数据库PISO。PISO一共获得了1,391,165个转录本,50,803个新基因位点,878,057个AS事件和81,416个APA事件。在此基础上构建了转录本浏览器和可变剪切搜索,可用于对处... 

【文章来源】:华中农业大学湖北省 211工程院校 教育部直属院校

【文章页数】:69 页

【学位级别】:硕士

【部分图文】:

基于三代转录组测序的植物全长转录本数据库构建及水稻杂种数据分型


三种主要的RNA测序技术原理(Starketal2019)

基因组,物种


基于三代转录组测序的植物全长转录本数据库构建及水稻杂种数据分型133结果与分析3.1数据结果统计PISO为用户提供大量高质量的AS事件、APA事件、新基因和全长转录本信息,从19种植物中一共获得了1,391,165个转录本,50,803个新基因位点,878,057个AS和81,416个APA事件。不同类型的可变剪切比例展示在图2.1和2.2中,其中13个有参考基因组物种记录在图2.1中,6个无参考基因组物种记录在图2.2中。13个有参考基因组物种中的11个物种可变剪切比例最高的类型为内含子保留,6个无参考基因组的物种中全部表现为内含子保留的比例最高。这些数据极大丰富了当前的注释信息,在这里以Amborellatrichopoda为例。Ensembl植物数据库中Amborellatrichopoda最新的基因组包含27,313个基因座和27,313个转录本,然而在本研究中一共检测到的9,060个表达基因位点中,获得了34,733个转录本,15,039个AS事件和3,315个APA事件,以及729个新基因。为了记录这些转录本的质量,研究通过SQANTI(Tardaguilaetal2018),基于参考注释的剪切情况对13个有参考基因组物种的分类,其中FSM和ISM的平均百分比约为24.1%,而NNC的平均百分比为58.7%(表2.5)。图2.113个有参考基因组物种可变剪切的统计Fig.2.1StatisticsofASeventsin13specieswithreferencegenome

基因组序列,物种,基因组,事件


华中农业大学2020届硕士研究生学位(毕业)论文14图2.26个无参考基因组物种可变剪切的统计Fig.2.2StatisticsofASeventsin6specieswithoutreferencegenome表2.419个物种数据总结Table2.4Summaryof19plantspecies物种SpeciesIso-Seq转录本TranscriptsofIso-Seq新基因NovelGenesAS事件ASEventsAPA事件APAevents家基因组序列SequencesofFakeGenomeAmborellatrichopoda34,73376915,0393,315Arabidopsisthaliana16,1379316,6841,852Betavulgarissubsp.vulgaris16,6651023,937650Chenopodiumquinoa557,9053,529138,26014,123Coffeaarabica35,15290436,8071,463Fragariavesca34,10751625,9665,122Gossypiumbarbadense63,88417,85868,6096,949Heveabrasiliensis29,88229737,4792,786Panaxginseng65,7797,50158,0653,782Phyllostachysedulis29,7843,89830,4312,799Sorghumbicolor35,78574528,3536,432Triticumaestivum227,52711,586186,01121,493Zeamays78,1443,005212,75910,650Alliumsativum21,7661,11617,331Astragalusmembranaceus56,93714,87724,523Dipteryxoleifera44,2122,82827,790Nepenthesampullaria15,80025613,317Nepenthesrafflesiana20,53728418,614Salviamiltiorrhiza6,4292964,875Total1,391,16550,803878,05781,416

【参考文献】:
硕士论文
[1]植物选择性多聚腺苷化分析与可视化平台搭建[D]. 张毓民.厦门大学 2017



本文编号:3466687

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/swxlw/3466687.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户99917***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com