基于RNA-Seq数据识别神经母细胞瘤中的环形RNA
发布时间:2017-04-27 16:04
本文关键词:基于RNA-Seq数据识别神经母细胞瘤中的环形RNA,由笔耕文化传播整理发布。
【摘要】:环形RNA(circ RNA)是细胞内一类非常特别的RNA,它来自外显子异常剪切,即一个来自下游的剪切片段和来自上游的剪切片段非常规地结合成为环形。不同于线性RNA的是,circ RNA是通过共价结合形成的环形RNA,并且这种环形相比其线性结构更加稳定。在经典的RNA测序中,由于环形RNA的末端结合在了一起,导致环形RNA缺少经典RNA测序的重要特征分子“尾巴结构”,因此这些环形RNA在过去的测序中并未引起普遍关注。但是新兴的生物信息学方法的发展以及深度测序技术的大量应用让更多的研究都聚焦在环形RNA上。已有研究显示环形RNA与基因转录后调控有密切联系,关于环形RNA更多的功能仍有待探索。因此环形RNA的鉴别对于理解复杂基因表达中的调控以及细胞功能的分子机制都有着极其重要的意义。在这篇论文里,重点是研究神经母细胞瘤的环形RNA鉴别以及相关生物统计分析。具体工作如下:我们对目前学术界流行的高通量测序技术和相关比对工具进行了全面深入的比较和分析,开发了一种生物信息学的计算方法来识别人类神经母细胞瘤中的环形RNA。选取神经母细胞瘤的四类细胞系CHLA、COG、SK-N-BE以及SMS的高通量RNA-seq测序结果作为数据处理对象。利用已注释的人类外显子边界序列构建“错序外显子-外显子连接数据库”。我们通过Bowtie2二代测序数据分析工具,将RNA-seq双端数据分别与ENSEMBL人类hg19全基因组参考序列以及“错序外显子-外显子连接数据库”进行两次比对。实验测序结果以及生物信息处理方法带来的误差可能会使得结果集中存在假阳性的环形转录本。因此我们利用统计学理论并使用使用R语言编程对候选数据集进行假阳性(FDR)控制。利用候选数据集中读片段分别构建空分布和待检验分布,将FDR控制在阈值以下。并对结果进行去冗余筛选与整理,我们对神经母细胞瘤的14个样本的环形RNA做了相关鉴定。最后,对找到的环形RNA作相关生物统计分析。我们发现,药物对于染色体上环形RNA的数量有显著影响,而对于母基因上环形RNA变体的数量影响不大;基因上环形RNA亚型的剪接位点大多数与基因的剪接位点是一致的。此外我们对能够转录出环形RNA的基因做了GO分析,探究形成环的基因参与形成的蛋白质在相关生物过程,分子功能以及细胞组件中的作用。
【关键词】:环形RNA 神经瘤母细胞 高通量测序 序列比对 假阳性
【学位授予单位】:南京航空航天大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:R739.4;Q811.4
【目录】:
- 摘要4-5
- ABSTRACT5-11
- 注释表11-12
- 第一章 绪论12-21
- 1.1 引言12-15
- 1.1.1 研究背景12-14
- 1.1.2 研究意义14-15
- 1.2 国内外研究进展15
- 1.3 本文的研究创新点15-16
- 1.4 本文的研究方案及关键问题16-19
- 1.4.1 研究方案16-18
- 1.4.2 拟解决的关键问题18-19
- 1.5 内容安排19-21
- 第二章 第二代测序序列比对方法研究现状21-28
- 2.1 引言21
- 2.2 新一代高通量测序技术简介21-23
- 2.2.1 高通量测序平台21
- 2.2.2 Illumina测序结果格式说明21-23
- 2.3 第二代测序数据比对工具23-24
- 2.4 Bowtie2 比对工具介绍24-27
- 2.4.1 Bowtie2 安装与使用24-25
- 2.4.2 Bowtie2 比对原理25-26
- 2.4.3 Bowtie2 与Bowtie1 的对比26-27
- 2.5 本章小结27-28
- 第三章 基于人类RNA-SEQ高通量测序数据筛选环形RNA28-43
- 3.1 引言28
- 3.2 错序外显子的形成28-29
- 3.2.1 错序外显子形成的两种机制28-29
- 3.2.2 环形模型筛选特征29
- 3.3 环形RNA鉴别——两次比对算法29-34
- 3.3.1 数据来源30
- 3.3.2 第一轮比对30-32
- 3.3.3 构建自建外显子-外显子数据库32-33
- 3.3.4 第二轮比对33-34
- 3.4 控制FDR与数据筛选34-42
- 3.4.1 假设检验34-35
- 3.4.2 FDR控制定义35
- 3.4.3 空分布和p-value35-37
- 3.4.4 多重检验校验37-41
- 3.4.5 环形RNA筛选和去冗余41-42
- 3.5 本章小结42-43
- 第四章 基于人类RNA-SEQ数据筛选环形RNA结果的统计分析43-72
- 4.1 引言43
- 4.2 环形RNA关于染色体的相关统计43-60
- 4.2.1 各细胞系环形RNA个数关于染色体分布43-46
- 4.2.2 染色体关于环形RNA分类46-53
- 4.2.3 药物对染色体——环形RNA个数分布的影响分析53-60
- 4.3 环形RNA关于基因的相关统计60-69
- 4.3.1 各细胞系环形RNA个数关于基因分布60-62
- 4.3.2 基因关于环形RNA的分类62-63
- 4.3.3 药物对基因——环形RNA个数分布的影响分析63-65
- 4.3.4 基因上环形RNA亚型剪切点选择的的研究65-67
- 4.3.5 转录环形RNA的基因的GO分析67-69
- 4.4 环形RNA外显子组成个数的统计69-70
- 4.5 本章小结70-72
- 第五章 总结与展望72-74
- 5.1 本文工作总结72
- 5.2 后续工作展望72-74
- 参考文献74-81
- 致谢81-82
- 在学期间的研究成果及学术论文情况82
【相似文献】
中国期刊全文数据库 前1条
1 刘学军;李蒙;张礼;;一种针对RNA-Seq数据的基因异构体表达水平计算方法[J];中国生物医学工程学报;2013年04期
中国博士学位论文全文数据库 前1条
1 曾p瑶;基于小鼠15个组织RNA-seq数据的全基因组重注释[D];中国科学院北京基因组研究所;2015年
中国硕士学位论文全文数据库 前5条
1 陈\,
本文编号:330923
本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/330923.html