基于滑窗的lncRNA二级结构预测

发布时间:2019-09-25 07:25
【摘要】:在生物学研究中,一直以来主要的课题都是围绕着蛋白质和相关蛋白质编码基因进行的。然而,随着RNA测序技术和用于组装转录组的计算方法的发展,除了编码哺乳动物基因组的大部分蛋白质编码基因外,许多非编码RNA(nc RNA)转录物在各种生物过程中正起着越来越重要的作用。理解nc RNA的功能已成为现代生物学研究中最重要的目标之一。nc RNA表示的是一种不被翻译成蛋白质的功能性RNA分子,其是一种缺少特异完整的开放阅读框的RNA。按照功能分类,可以分为两种类型,一种是看家非编码RNA(Housekeeping non-coding RNA),一种是调控非编码RNA(Regulatory non-coding RNA)。按照长度分类,可以分为短链非编码RNA和长链非编码RNA(lncRNA)。lncRNA通常指的是长度大于200核苷酸单位的非编码RNA。近期的研究表明,lncRNA可以作为各种生物过程中重要的顺式或反式调节剂,也可以使用各种机制来影响基因的表达,lncRNA中的突变与各种各样的疾病,特别是癌症和神经变性疾病有关。即使如此,大多数lncRNA的功能和分子机制是未知的。尽管已经开发了多种计算方法来预测lncRNA的功能,但预测其功能仍然是一项具有挑战性的任务,部分原因就是lncRNAs序列和二级结构缺乏保守性。由此可知,lncRNA在生物功能与机制上有着非常巨大的作用,但是由于其长度较长,功能表述不清楚,给研究人员研究其生物功能造成了巨大的困难。经过调查研究发现,目前主流的RNA二级结构预测算法主要集中在短链上,对lncRNA二级结构的研究基本还处于探索阶段,所以本文基于局部预测算法和平衡能能量模型,提出了基于滑窗的lncRNA二级结构预测的算法。首先,利用局部预测算法对lncRNA的局部结构进行预测,之后利用平衡能量模型选取多个预测结构中的最优结构。为了验证算法的有效性,我们选取了广泛使用的silva数据库和RNA STRAND数据的数据对算法进行了验证,并将预测结果和主流的预测算法进行了比较。通过和中国人民解放军第四军医大学的合作并作进一步的深入研究,我们的lncRNA二级结构预测算法的效率和准确性都会得到提升。我们深知该算法还有很多不足之处,但是我们还在不断努力,使其功能更加的齐全,性能更加的强劲的愿望,是使我们不断进步的动力,也是我们努力的方向。
【图文】:

碱基对,嵌套,螺旋,最小自由能


基决定了螺旋的堆叠,因此它们形成了三维结构。经常会发现四个螺旋通过一多分支环连结在一起,例如在 tRNA 中,但也有或多或少的螺旋连结在一起。正规的定义中,一个 K-多分支环既是内部碱基对(i1,j1)…(ik,jk) ∈ R,闭合基对(i,j)∈ R 的环。6. 假结是 RNA 的一种三级结构单位。一个发夹环中的核苷酸和茎区外部的苷酸形成了碱基对。因此碱基对在它们序列的位置上出现了互相的重叠。在正的定义中我们可以说假结是违背了被所有非假结结构所遵守的嵌套原则的一结构,正如上面所描述的一样。嵌套原则表明对于任何两个碱基对(i,j)∈R,(k,l) R,并且 i<j,k<l,i<k,总会有 i<k<l<j 或者 i<j<k<l。因此在假结结构中存在至少两碱基对(i,j)∈ R,(k,l) ∈ R, 并且 i<j,k<l,i<k 且 i<k<j<l。假结的预测是非常的,事实表明对于假结结构的预测是带有最小自由能的,这意味着找到最稳定结构是一个 NP-完全问题。已经证明假结预测问题可以减小到已知的 NP-完全SAT 问题,因此它也是 NP-完全问题。其中假结结构如下[19]:

序列,碱基对,表示法,结构元素


蓝线只表示假结的氢键。通过对每个碱基简单的计算角度,圆圈绘图法已经被现了。例如如果序列包含 36 个碱基,然后 360°就被 36 所平分,因此很显然弯转 10°就放一个新碱基。每个碱基的正确坐标通过 sin 和 cos 函数来计算。第三种表示法和所谓的潦草绘图法很类似,这是最好的类似于真实二级结的符号,但是不能表示假结[23]。和圆圈绘图法一样,,碱基由黑点和它们的字符示,共价键由灰色的线表示,氢键由红色的线表示,假结的氢键由蓝色的线表示实际上,这种方法是可以表示假结的,但在生物学上是毫无意义的。茎区或者螺旋以一种类似轨道的结构表示,而且环的闭合碱基对有着和茎碱基对一样的距离。环通过等角多边形来表示。这样就可以观察到一个非常紧的图形,并且不同结构元素之间重叠的可能性是非常小的。但是环可能变得非小,以至于环不能进行比较,而且随着序列的增长,环变得太小以至于很难注到它们,表示方法为[24]:
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:Q752

【参考文献】

相关期刊论文 前6条

1 孙磊;张林;刘辉;;基于RNA-Seq的长非编码RNA预测[J];生物化学与生物物理进展;2012年12期

2 董浩;刘元宁;张浩;王刚;;基于隐Markov模型的RNA二级结构预测新方法[J];计算机研究与发展;2012年04期

3 ;Simulating the Folding Pathway of RNA Secondary Structure Using the Modified Ant Colony Algorithm[J];Journal of Bionic Engineering;2010年04期

4 邹权;郭茂祖;张涛涛;;RNA二级结构预测方法综述[J];电子学报;2008年02期

5 朱杰;;生物信息学的研究现状及其发展问题的探讨[J];生物信息学;2005年04期

6 张春霆;生物信息学的现状与展望[J];世界科技研究与发展;2000年06期

相关硕士学位论文 前1条

1 李函蔚;IncRNA UCA1在胃癌中的作用及胃癌血浆RNA肿瘤标志物的筛选研究[D];吉林大学;2015年



本文编号:2541310

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/2541310.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f7f80***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com