当前位置:主页 > 理工论文 > 生物学论文 >

基于转录组测序数据的递归剪接事件识别及其应用

发布时间:2020-10-28 05:32
   在高等真核生物基因组转录过程中,一次剪接即可完成短内含子的去除,而部分较长内含子(10 kbp)则需通过多次剪接方可去除。多次剪接去除长内含子的过程通常被称为递归剪接。已有研究表明,递归剪接事件与诸多生物学过程及疾病的发生发展有着密切的联系。近年来,关于递归性剪接事件的研究越来越多,研究者已经在果蝇和多种脊椎动物基因组转录过程中发现了递归剪接事件,通过不同的生物信息学方法找到了多个递归剪接位点并进行了实验验证。目前国际上对递归剪接的研究主要集中在递归剪接过程、剪接位点识别及其对生物学过程的影响等方面。但是尚未有比较成熟的识别递归剪接位点的软件,本文针对转录组数据进行递归剪接事件的识别方法研究,并开发了一套识别递归剪接位点的算法流程RSfinder。同时利用RSfinder对卵巢癌组织和癌旁正常组织的转录组数据进行递归剪接位点的识别与分析。以下是本文的主要工作:首先,分析递归剪接位点附近序列特征。本文分别对实验验证的人脑组织的7个基因的8个递归剪接位点、果蝇的14个基因的24个递归剪接位点进行了研究,对这些递归剪接位点上下游序列进行序列比对统计、分析。研究结果发现发生递归剪接现象的三组序列特征,即:剪接位点的保守性、发生递归剪接现象的内含子长度、内含子表达量信息呈现锯齿状。其次,本文开发了一套识别递归剪接位点的算法流程RSfinder。RSfinder对上述已验证递归剪接位点的转录组测序数据进行分析检测的具体步骤如下:1,以基因组碱基序列、基因注释文件为参考,运用fastQC进行质量检测;2,利用TopHat对转录组数据进行比对,得到读段的整体比对结果Sam文件和junction文件;3,通过递归剪接位点特征信息进行分析筛选,得到符合上述特征的潜在递归剪接位点;4,利用序列信息构造生物剪接的亲和性矩阵对递归剪接位点进一步筛选;5,编写的可视化工具RS-fig肉眼识别锯齿状结构、非锯齿结构;6,利用PCCAdaBoost算法对样本进行训练,得到准确率达95%以上的分类器,即得到符合条件的递归剪接位点识别算法流程(RSfinder)。运用RSfinder对Homo sapiens已验证的八个递归剪接位点、果蝇24个位点所在的转录组进行分析检测,比较检测结果,验证算法流程RSfinder的准确性,结果表明RSfinder算法流程性能较好,能够在人脑组织检测到7个(87.5%)递归剪接位点;果蝇中检测到23个(95.8%)递归剪接位点。最后,应用所开发的算法流程对卵巢癌中发生递归剪接事件进行了检测与分析。卵巢癌数据分为两组:卵巢癌组织和癌旁正常组织,每组数据集三个生物学重复。得到的转录组数据利用RSfinder进行分析,预测得到递归剪接位点,分析两组数据集递归剪接位点所在基因的差异性。结果发现卵巢癌组织中发现递归剪接事件、癌旁正常组织未发生的位点共31个,存在于25个基因的25个内含子中;癌旁正常组织存在递归剪接事件、卵巢癌组织未检测到的位点共43个,存在于31个基因的31个内含子内。此外本文还对得到的这两组基因的表达量信息进行了分析。本论文的研究工作,也为递归剪接事件对卵巢癌的影响进行深入研究奠定了一定的基础。
【学位单位】:南京航空航天大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:Q811.4
【部分图文】:

方案,事件,递归,过程预测


图 1. 1 总体研究方案排方法开发一套识别递归剪接位点矩阵、相似性筛选等过程预测得筛选,得到所需要的样本。利用点识别软件。利用 RSfinder 对卵剪接事件的基因的差异性,从递如下:和研究意义,简单介绍了论文所思路,最后概述了本章内容。生递归剪接事件的研究现状事件的研究现状。描述了二代测

流程图,内含子,单步,流程图


图 2. 1 内含子单步剪接流程图2 表示的是“外显子-内含子-外显子”模型单步剪接 reads 密度图。图 A 为 reads 表达模型图,图中可以看出单步剪接内含子的表达量图谱从 5’到 3’呈图 B 为本文通过 RS-fig 软件对某一内含子与上下游两外显子之间表达量图图,从图中可以看出内含子的去除为单步剪接时,内含子表达量图谱会呈现”,且内含子部分表达量图谱呈现直线向下。

单步,图谱,内含子,外显子


图 2. 1 内含子单步剪接流程图图 2.2 表示的是“外显子-内含子-外显子”模型单步剪接 reads 密度图。图 A 为内含子单步接切的 reads 表达模型图,图中可以看出单步剪接内含子的表达量图谱从 5’到 3’呈现斜向下的直线。图 B 为本文通过 RS-fig 软件对某一内含子与上下游两外显子之间表达量图谱进行绘制的结果图,从图中可以看出内含子的去除为单步剪接时,内含子表达量图谱会呈现明显的“三角状”,且内含子部分表达量图谱呈现直线向下。
【相似文献】

相关期刊论文 前10条

1 冯桂海;何涛;汪莉;王玉民;;果蝇非经典剪接位点的生物信息学预测[J];生物技术通讯;2010年06期

2 孙波;李小霞;李铖果;;基于模糊支持向量机的剪接位点识别[J];计算机应用;2011年04期

3 晏春,杜耀华,高青斌,王正志;基于支持向量机的人类5'非翻译区剪接位点识别[J];生物物理学报;2005年04期

4 郑毅,丁达夫;果蝇内含子3'剪接位点的选择机制[J];生物物理学报;1994年03期

5 王科俊;吕俊杰;冯伟兴;王鑫;贺波;;一种新的真核基因剪接位点识别方法[J];电子学报;2011年05期

6 陈丽萍;吕军;;利用多样性增量位置得分函数预测人类5'非翻译区剪接位点[J];内蒙古工业大学学报(自然科学版);2009年04期

7 刘良式;转录物剪接的分子机理[J];植物生理学通讯;1995年05期

8 曾莹;陈渊;袁哲明;;基于统计差表与加权投票的高精度剪接位点预测[J];生物化学与生物物理进展;2019年05期

9 杨乌日吐;李前忠;林昊;杨科利;;预测竞争性和非竞争性剪接位点对(英文)[J];内蒙古大学学报(自然科学版);2008年03期

10 冯秀程,钱敏平,邓明华,马小土,严熙婷;隐半马氏模型在 3′剪接位点识别中的应用(英文)[J];生物化学与生物物理进展;2004年05期


相关博士学位论文 前4条

1 晋宏营;最大信息原理、能量及选择约束在基因剪接位点预测分析中应用的研究[D];内蒙古大学;2009年

2 刘薇;选择性剪接顺式调控元件的位置效应[D];武汉大学;2010年

3 吴同彬;PPT结合蛋白结合位点定位揭示出其在前体mRNA剪接中的多样功能[D];武汉大学;2010年

4 杨乌日吐;基于序列信息预测选择性剪接位点和盒式外显子[D];内蒙古大学;2008年


相关硕士学位论文 前10条

1 魏金川;基于转录组测序数据的递归剪接事件识别及其应用[D];南京航空航天大学;2019年

2 李瑞;基于深度学习的农作物基因剪接位点识别研究[D];山东农业大学;2019年

3 姚雨;基于深度学习网络的剪接位点及蛋白质相互作用预测方法研究[D];安徽大学;2019年

4 夏慧煜;剪接位点识别与选择性剪接机制的初步研究[D];清华大学;2004年

5 吕俊杰;真核基因剪接位点识别算法研究[D];哈尔滨工程大学;2010年

6 郑大军;真核基因剪接位点的特征描述与识别算法研究[D];福建农林大学;2014年

7 孙永山;基于序列模式挖掘识别基因剪接位点的研究[D];安徽大学;2016年

8 李绍燕;基于变长马尔可夫模型的基因剪接位点识别[D];苏州大学;2011年

9 王卉;蛋白质编码基因及遗传疾病相关基因的预测[D];华中科技大学;2006年

10 张鹏飞;人类基因组中选择性剪接位点的预测及序列特征分析[D];内蒙古大学;2010年



本文编号:2859663

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/swxlw/2859663.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户58c65***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com