QuaPra软件的开发及其在大鼠转录组重构中的应用
发布时间:2020-09-08 14:36
RNA测序(RNA-seq)极大地促进了对不同生物体的转录组全景图的探索。然而,由于当前的分析软件和测序技术的各种限制,转录组重建仍然具有挑战性。本论文构建了一个有效的工具QuaPra(Quadratic Programming combined with Apriori,结合Apriori算法的二次规划),用于转录组的精确组装和定量。与其他目前流行的软件相比,QuaPra的灵敏度和精密度比其他当前流行的工具至少高2.7%,并且可以检测到至少26.5%更多的低丰度(0.1~1 FPKM)的转录本。此外在真实测序数据中,QuaPra比其他同类型软件正确组装的已知转录本至少多1/4。大鼠是生物医学研究中重要的模式生物,但其尚有很多基因仍未被注释。本论文使用从SEQC项目团队生成的320个样品中11种不同器官的RNA-Seq数据,使用Stringtie和QuaPra这两个转录本拼接软件重构了大鼠转录组(Rat Transcriptome Re-annotation,RTR)。RTR媲美已注释的小鼠转录组。在RTR中注释有61,582个基因和130,308个转录本,分别占了基因组~44%和~10%的区域。在新发现的剪接位点中,有35%是半保守的,这是产生具有潜在生物学意义的新转录本的主要机制。在RTR所注释的130,308个转录本中,有37,203个新转录本被标注为高可信度的可编码转录本,34,718个新转录本被标注为高可信度的长非编码转录本。本论文对37,203个高可信度的可编码转录本中的36,564个进行了功能注释。新的转录本和转座元件之间的重叠度是远远超过已知的转录本和转座因子的重叠度。此外,我们还发现在所有11个组织中均有表达的10,356个管家基因和12,905个管家转录本,其中748个管家基因在不同组织中表达不同的转录本。RTR这一新的大鼠转录组为大鼠疾病和毒性模型的遗传学和基因表达研究提供了必要的参考。
【学位单位】:华东师范大学
【学位级别】:博士
【学位年份】:2018
【中图分类】:Q811.4;TP311.52
【部分图文】:
多基因转录本的识别
转录组测序数据的不同分析流程
读段重叠图[14]
【学位单位】:华东师范大学
【学位级别】:博士
【学位年份】:2018
【中图分类】:Q811.4;TP311.52
【部分图文】:
多基因转录本的识别
转录组测序数据的不同分析流程
读段重叠图[14]
【相似文献】
相关期刊论文 前10条
1 马强;;反义转录本的研究现状及意义探讨[J];科技展望;2015年16期
2 李黎;5′外显子及多聚嘌呤化位点的变换可使单拷贝基因产生多种转录本[J];国外医学(分子生物学分册);1994年01期
3 ;国内期刊亮点[J];科技导报;2014年14期
4 安莉莉;马小彤;石洋;林永敏;郑国光;吴克复;;胚胎发育相关基因精子转录本在白血病细胞系中的表达及其调节[J];白血病.淋巴瘤;2006年01期
5 贾侃;赵r嚺
本文编号:2814294
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2814294.html