长非编码RNA二级结构预测方法的研究与实现
发布时间:2020-07-19 15:25
【摘要】:近年来,长非编码RNA(lncRNA)因其潜在的生物学功能而备受关注。借助高通量转录组测序技术(RNA-Seq),研究者已经在包括人、小鼠等哺乳动物在内的多种生物中发现了数以十万计的lncRNA。研究表明,lncRNA普遍具有低序列保守性和低表达水平的特点,因此难以直接建立序列与功能之间的联系。鉴于功能性非编码RNA(ncRNA)在二级结构层面具有保守性,由此推断功能相近的lncRNA的二级结构也同样具有一定程度的保守性。本文主要借助生物信息学方法,围绕lncRNA二级结构预测问题展开研究和开发。主要工作如下:(1)研究了主流的RNA二级结构预测方法(主要包括比较序列分析法、动态规划算法和基于机器学习的分类预测方法等类别),分析并比较了这些方法的优缺点。综述了主要的ncRNA序列和结构数据库,包括miRBase、GtRNAdb、RNaseP数据库、Rfam、GENCODE、lncRNAdb 和 NONCODE 等。(2)在此基础上,提出RNA二级结构预测的评估系统(lncRScan-Fold-Assess),其主要功能包括:报告利用RNA二级结构预测方法预测得到的RNA二级结构信息、计算RNA二级结构预测方法的预测精度和比较不同的RNA二级结构预测方法的性能等。lncRScan-Fold-Assess 提供了 RNAfold、MARNA、Mfold、Pfold、Sfold、RNAstructure 和CentroidFold七种主流的RNA二级结构预测方法的预测功能。(3)为了更好地将我们设计的RNA二级结构预测的评估系统用于科学研究。我们设计实验将 lncRScan-Fold-Assess 应用于 miRNA、tRNA、RNasePRNA、ncRNA 和 lncRNA,结果表明:在预测一组同源序列时,基于比较分析法的Pfold和质心法CentroidFold的效果明显优于基于最小自由能的RNAfold、mfold、Sfold和RNAStructure。但是,预测一条单个序列的时候,基于不同原理的预测方法得到的结果没有明显的差异。综上,用户利用lncRScan-Fold-Assess可以同时对多种RNA二级结构预测方法的性能进行评估,进而可以选择性能较好的方法输出结果,因此lncRScan-Fold-Assess可以帮助提高当前lncRNA二级结构预测的效率。
【学位授予单位】:扬州大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:O157.4
【图文】:
图2.1邋RNA二级结构的平面图表示法逡逑
逑平面图表示法[23]是常见的RNA二级结构表示方法,即在二维平面上绘制RNA二级结逡逑构的碱基配对情况(如图2.1)。图中RNA序列的碱基沿一条曲线依次排列,碱基之间的逡逑点代表碱基对。逡逑圈图(circle邋graph)是另外一种平面图表亦法,它将RNA序列按顺序均勾地绕圆圈分逡逑布,碱基对用弧线连接(如图2.2)。逡逑■m逡逑r邋A邋6逦*邋f邋C邋ji逡逑(P逡逑_逡逑c邋h邋IH邋l逡逑r邋I逡逑7¥逡逑图2.2邋RNA二级结构的平面图表示方法(圈图)逡逑2.2.2点-括号对表不法逡逑点-括号对是用一对括号表示一对碱基配对的关系[24],没有发生交叉就用小括号代替,逡逑有发生交叉则用中括号,没有匹配的则用冒号表示。点-括号对的表达方法如下:逡逑用7?来表示某一个序列,穴=邮2...1*11,其中1^{417,(7,(:};/_邋=邋],2...11,则及上的二级逡逑结构点-括号表示法的定义为:字符序列5"=siS2...sn。则有以下要求:逡逑(1)
(-0.480,0.150,0.208),(-0.950,0.279,0.146),(-0.472,-1.280,0.098),(1.180,-0.640,0.066),(-0.620,0.3逡逑90,0.045),(-0.520,-0.510,0.029),(0.450,-0.050,0.023),(0.932,-0.232,0.017)},在邋3-D邋空间里的有逡逑向曲线表示,见图2.4。逡逑0邋25-1逦^逡逑]邋/邋\逡逑/邋\逡逑0.2-1逦,\逡逑/邋\逡逑0,15i逦/逦\逡逑0.05」逦c-一-一一一逡逑0邋丨邋—逡逑V邋j^逦逦逡逑1邋---一-一;逦2逡逑0)邋0一一0邋1逡逑-1.5邋**1逡逑图2.4序列AUGCLrC'AU'Gf对应的有向曲线逡逑
本文编号:2762595
【学位授予单位】:扬州大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:O157.4
【图文】:
图2.1邋RNA二级结构的平面图表示法逡逑
逑平面图表示法[23]是常见的RNA二级结构表示方法,即在二维平面上绘制RNA二级结逡逑构的碱基配对情况(如图2.1)。图中RNA序列的碱基沿一条曲线依次排列,碱基之间的逡逑点代表碱基对。逡逑圈图(circle邋graph)是另外一种平面图表亦法,它将RNA序列按顺序均勾地绕圆圈分逡逑布,碱基对用弧线连接(如图2.2)。逡逑■m逡逑r邋A邋6逦*邋f邋C邋ji逡逑(P逡逑_逡逑c邋h邋IH邋l逡逑r邋I逡逑7¥逡逑图2.2邋RNA二级结构的平面图表示方法(圈图)逡逑2.2.2点-括号对表不法逡逑点-括号对是用一对括号表示一对碱基配对的关系[24],没有发生交叉就用小括号代替,逡逑有发生交叉则用中括号,没有匹配的则用冒号表示。点-括号对的表达方法如下:逡逑用7?来表示某一个序列,穴=邮2...1*11,其中1^{417,(7,(:};/_邋=邋],2...11,则及上的二级逡逑结构点-括号表示法的定义为:字符序列5"=siS2...sn。则有以下要求:逡逑(1)
(-0.480,0.150,0.208),(-0.950,0.279,0.146),(-0.472,-1.280,0.098),(1.180,-0.640,0.066),(-0.620,0.3逡逑90,0.045),(-0.520,-0.510,0.029),(0.450,-0.050,0.023),(0.932,-0.232,0.017)},在邋3-D邋空间里的有逡逑向曲线表示,见图2.4。逡逑0邋25-1逦^逡逑]邋/邋\逡逑/邋\逡逑0.2-1逦,\逡逑/邋\逡逑0,15i逦/逦\逡逑0.05」逦c-一-一一一逡逑0邋丨邋—逡逑V邋j^逦逦逡逑1邋---一-一;逦2逡逑0)邋0一一0邋1逡逑-1.5邋**1逡逑图2.4序列AUGCLrC'AU'Gf对应的有向曲线逡逑
【参考文献】
相关期刊论文 前6条
1 王婷梅;曲丽娜;李莹辉;;LncRNA的结构、功能及其与疾病的关系[J];中国生物化学与分子生物学报;2015年07期
2 黄伊子;李都悦;刘伟;周玮;;RNA二级结构预测算法的研究进展[J];湖南农业科学;2014年18期
3 高青;鞠志花;王长法;李国荣;;miRBase-microRNA序列数据库[J];家畜生态学报;2011年06期
4 白凤兰;徐丽;;RNA二级结构的数学表示及其应用[J];大连交通大学学报;2010年06期
5 宁正元;林世强;;RNA二级结构预测方法[J];福建农林大学学报(自然科学版);2007年01期
6 廖波,王天明;RNA二级结构的最小自由能算法[J];生物数学学报;2003年03期
相关硕士学位论文 前1条
1 苑寅;带假结RNA二级结构预测研究[D];电子科技大学;2013年
本文编号:2762595
本文链接:https://www.wllwen.com/kejilunwen/yysx/2762595.html