基于高通量测序技术的非编码RNA研究
发布时间:2017-09-12 11:16
本文关键词:基于高通量测序技术的非编码RNA研究
更多相关文章: 微小RNA 生物信息学 功能性非编码RNA 16S核糖体RNA 高通量测序 微小RNA异构体 长非编码RNA 转录组测序 质量控制
【摘要】:非编码序列RNA不能被翻译生成蛋白质序列,但非编码RNA可单独行使调控功能或与其他功能性生物大分子结合行使作用,具有非常重要的生物学功能。随着高通量测序技术的发展,产生了大量的非编码RNA测序数据,针对这些数据展开研究能够更好地揭示其生物学意义。针对海量的高通量非编码RNA测序数据的生物信息学分析是近年来的研究热点,相关的分析方法尚需进一步完善。本研究主要针对高通量测序技术下对非编码RNA分析的模型建立、流程构建、方法优化等方面开展了较为系统的研究工作,并探讨了非编码RNA可能的进化机制。本研究取得的主要成果为:(1)开发了一套基于SOLiD测序平台的小RNA测序数据的分析流程,可针对色域编码的测序结果进行分析及可视化显示,能够比较样本间小RNA表达量的差异及对新的miRNA进行预测。该流程已成功地应用于孕妇子痫相关的miRNA标记基因的研究。(2)在高通量测序数据中存在miRNA的异构体现象,这些异构体可能具有重要的生物学功能。为了评估miRNA的异构水平,本论文提出了一种基于熵的方法用于研究高通量小RNA测序数据中miRNA异构体,发现异构水平比较高的ImiRNA的靶基因能富集到肿瘤相关的功能上,说明这些异构体并不是随机产生的。将这个模型应用于阿尔兹海默症的高通量测序数据中,发现有47个miNRA基因的异构水平在该疾病的早期和晚期之间存在显著的差异,其中17个是已知的疾病相关的miRNA (P1.59e-07)。与其miRNA表达量差异相比,发现基于miRNA 5'端异构的熵差异的方法在阿尔兹海默症中表现出更加稳定的结果;(3)为了研究高通量转录组数据分析过程中出现的无法比对到基因组的高质量的序列,本论文设计了一套流程来分析前列腺癌中这些未知的存在差异表达的转录片段,排除可能的污染和低复杂度序列后,发现了214个可能与疾病相关的长度大于200个碱基的片段,通过一个非比对的模型来对这些片段是否是非编码RNA进行快速判断;(4)微生物群落的鉴定主要是通过高通量测序16S rRNA的高变区来进行。这需要设计引物对其高变区进行扩增,由于读长短导致很多物种不能被鉴定到属水平。本论文提出通过属特异性片段来检测特定属的方法,探讨适合短读长高通量测序数据中检测出更多的属水平物种的策略。鉴于各个属的属特异性区域分布不同,通过一对引物进行扩增通常存在很大的偏好,而使用多个区域则可以明显提高检测微生物群落的能力,且有更多物种能被鉴定到属水平。(5)本论文还对miRNA和长链非编码RNA的起源进行了探讨。通过序列相似性比对的方法在古菌种找到了56 miRNA的前体同源序列,及通过二项式分布模型在古菌中找到了2649种潜在的miRNA种子序列,这些种子序列与真核生物对应的种子序列存在明显的交集,研究表明在古菌与真核生物进化分歧之前就可能已经存在miRNA。首次在全基因组范围内分析了动物基因组序列的对称性特征,发现链内对称偏性的增加伴随着功能性非编码RNA的增加,该研究在一定程度上解释了功能性非编码RNA的数量随着物种复杂性增加而增加的现象。
【关键词】:微小RNA 生物信息学 功能性非编码RNA 16S核糖体RNA 高通量测序 微小RNA异构体 长非编码RNA 转录组测序 质量控制
【学位授予单位】:东南大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:Q811.4;R3416
【目录】:
- 中文摘要4-6
- 英文摘要6-10
- 第一章 绪论10-14
- 1.1 研究课题的背景和意义10-11
- 1.2 当前研究状况及存在的问题11-14
- 第二章 基于高通量测序技术的小RNA研究14-38
- 2.1 基于SOLiD平台构建小RNA分析流程14-16
- 2.1.1 引论14
- 2.1.2 流程简介14-16
- 2.2 基于熵的miRNA异构体分析16-23
- 2.2.1 引论16-17
- 2.2.2 材料与方法17-19
- 2.2.2.1 数据来源17
- 2.2.2.2 熵的计算17-19
- 2.2.2.3 功能富集分析19
- 2.2.3 结果19-22
- 2.2.3.1 MIH值概述19-20
- 2.2.3.2 相关性分析20-21
- 2.2.3.3 功能富集分析21-22
- 2.2.4 讨论22-23
- 2.2.5 小结23
- 2.3 基于熵的阿尔茨海默症miRNA 5’端异构体表达失调检测23-38
- 2.3.1 引论23-24
- 2.3.2 材料与方法24-26
- 2.3.2.1 数据来源与miRNA分析24
- 2.3.2.2 5’端异构的计算24-25
- 2.3.2.3 统计检测与评估25
- 2.3.2.4 isomiR异构体种子序列分析25-26
- 2.3.2.5 miRNA的差异表达分析26
- 2.3.3 结果26-36
- 2.3.3.1 基于熵得到的MIH5值概述26-27
- 2.3.3.2 5’端isomiR中第二频率的种子序列潜在的功能分析27-34
- 2.3.3.3 基于5’端异构体的秩和检验方法与基于表达量差异的方法之间的比较34-36
- 2.3.4 讨论36
- 2.3.5 小结36-38
- 第三章 基于高通量测序技术的长链非编码RNA研究38-56
- 3.1 转录组测序数据分析与lncRNA的识别38-41
- 3.1.1 引论38
- 3.1.2 转录组数据的收集与处理38-39
- 3.1.3 检测差异表达的转录本39-40
- 3.1.4 小结40-41
- 3.2 高通量测序技术下微生物群落鉴定的优化41-56
- 3.2.1 引论41
- 3.2.2 材料与方法41-43
- 3.2.3 结果43-53
- 3.2.3.1 选取的21个属中特异性片段及保守位点分析43-47
- 3.2.3.2 超变区间高比率属特异性片段的分布47-49
- 3.2.3.3 不同的片段长度下属特异性分析49-53
- 3.2.4 讨论53-54
- 3.2.5 小结54-56
- 第四章 非编码RNA的起源探讨56-77
- 4.1 关于miRNA的起源探讨56-63
- 4.1.1 引言56-57
- 4.1.2 材料和方法57-59
- 4.1.3 结果与讨论59-63
- 4.2 从miRNA的保守种子序列进一步探讨miRNA的起源63-68
- 4.2.1 引论63
- 4.2.2 材料和方法63-65
- 4.2.3 结果与讨论65-67
- 4.2.3.1 全基因组种子序列预测概述65
- 4.2.3.2 种子序列预测结果的可靠性分析65-66
- 4.2.3.3 种子序列的保守型信息66
- 4.2.3.4 靶基因功能注释66-67
- 4.2.4 小结67-68
- 4.3 关于功能性非编码RNA的起源探讨68-77
- 4.3.1 引论68
- 4.3.2 材料与方法68-69
- 4.3.3 基因组链内对称偏性分析69-73
- 4.3.4 链内对称偏性的增加与功能性非编码RNA的关系探讨73-76
- 4.3.5 小结76-77
- 第五章 总结与展望77-79
- 5.1 总结77
- 5.2 展望77-79
- 参考文献79-92
- 附录92-118
- 在学期间发表的论文118-119
- 致谢119
本文编号:836893
本文链接:https://www.wllwen.com/shoufeilunwen/jckxbs/836893.html