基于RNA二级结构表示法的结构比对算法的研究与实现

发布时间:2022-01-05 04:58
  RNA种类较多,其中大部分RNA分子不参与蛋白质合成,但仍然可以在生物体内行使生物功能,因此RNA功能的研究已经成为生物信息学领域重要研究内容之一。RNA功能由其自身结构决定,功能不同的RNA其二级结构会折叠成不同的形状,因此对二级结构研究将会为功能研究提供帮助。RNA结构不稳定、保守性高,直接通过生物实验的方法测定结构信息不仅花费高、实验周期长,而且实验效率低,很难得出RNA结构信息。所以需要生物信息学的方法预测二级结构信息。RNA二级结构信息预测是将待预测的RNA与已知二级结构信息的RNA进行比对。目前,RNA结构比对算法大部分是基于RNA二级结构表示法进行的比对,因此二级结构表示法能够影响比对方法的性能。在此背景下,本文针对RNA二级结构比对算法进行研究。(1)基于数字序列表示法的RNA二级结构比对。在传统的RNA结构比对算法存在RNA二级结构信息易丢失等缺陷背景下,提出一种新的RNA结构表示法——数字序列表示法,根据定义将二级结构转换成数字序列,在此基础上我们提出一种新的比对算法,称为DSARna。首先基于动态规划算法构建比对矩阵,之后再构建二进制路径矩阵,在路径矩阵中找出回溯... 

【文章来源】:淮北师范大学安徽省

【文章页数】:62 页

【学位级别】:硕士

【部分图文】:

基于RNA二级结构表示法的结构比对算法的研究与实现


RNA二级结构单元

二级结构,圆弧,图表,碱基


基于RNA二级结构表示法的结构比对算法的研究与实现(4)凸环:指RNA一级结构在形成高级结构单元时,在一条单链上存在一个或者多个为配对的碱基形成的凸起。(4)内环:指RNA一级结构在形成高级结构单元时,在两条单链上存在一个或者多个为配对的碱基形成的具有对称结构的两个凸环。(5)多分支环:由多个未配对连续碱基与三个或三个以上的茎构成的多环。2.2RNA二级结构表示方法RNA二级结构并不真实存在于生物体中,仅仅反映RNA序列的多个核糖核苷酸互补配对形成的平面结构,二级平面图结构的定义由Waterman等人[67]在1978年提出,通过平面图只能了解到RNA分子的碱基配对情况,如图2.2(b)所示。RNA二级结构表示是RNA二级结构比对研究中的一个重要部分,因为RNA二级结构维度高,直接用来比对复杂度高、难度大,并且无法使用数学模型和计算机的方法来进行比对,而将维度高的二级结构表示成低维度的序列则可以被计算机识别并计算,这会大大提高实验效率。近年来,学者们构建出了多种RNA二级结构表示法,大致可以分为四种类型,详细介绍如下。2.2.1平面图形表示法平面图形表示法有多种,例如圆弧图、圆圈图、山峰图、树表示法和点图表示法。圆弧图是指RNA序列中如果两个碱基配对,就用圆弧将这两个碱基连接,因此叫圆弧图,如图2.4所示。图2.4二级结构圆弧图表示法圆圈图是指将RNA的圆弧图首位相连,圆弧放在圆内部,因此构成了圆圈图,如图2.5所示。13

二级结构,图表,山峰,碱基


基于RNA二级结构表示法的结构比对算法的研究与实现图2.5二级结构圆圈图表示法山峰图是指将RNA水平放置,从两侧向中间进行绘制折线,其中斜线表示茎区,平原表示为配对碱基,山谷表示多分支环中未配对碱基,山峰表示发卡环,高度m(k)由位置k处的碱基对数量决定,最终形成像山峰一样的图像,因此命名为山峰图,如图2.6所示。图2.6二级结构山峰图表示法树是一种特殊的图,树表示法是指将RNA二级结构看成一颗有序树,将配对碱基作为树的内部结点,将单碱基作为树的叶子结点,其中根节点不表示任何碱基,如图2.7所示。图2.7二级结构树表示法点图表示法是指使用二维坐标将RNA二级结构进行转化,坐标中的点为相14

【参考文献】:
期刊论文
[1]人工智能在药物研发中的应用进展[J]. 丁伯祥,胡健,王继芳.  山东化工. 2019(22)
[2]一种自适应序列长度的RNA二级结构深度预测方法[J]. 吴宏杰,汤烨,陆卫忠,崔志明,付保川,GAO Zhen.  小型微型计算机系统. 2019(08)
[3]非编码RNA的功能以及和疾病的关系[J]. 崔庆华.  生理科学进展. 2016(03)
[4]一种新的RNA二级结构特征序列表示及相似性分析[J]. 梁成,骆嘉伟,李仁发.  计算机应用研究. 2011(03)
[5]基于奇异值分解的RNA二级结构相似度计算方法[J]. 刘琦,张引,叶修梓,俞荣栋.  浙江大学学报(工学版). 2007(08)
[6]一种新的RNA二级结构的三维图形表示[J]. 单夫一,骆嘉伟.  武汉理工大学学报(信息与管理工程版). 2007(05)
[7]非编码RNA——功能基因组研究的新热点[J]. 杨琳,柯杨.  北京大学学报(医学版). 2006(04)
[8]RNA-Z曲线及其在病毒基因识别中的应用[J]. 韩乐,莫忠息.  生物数学学报. 2004(02)
[9]人类基因组计划与后基因组时代[J]. 骆建新,郑崛村,马用信,张思仲.  中国生物工程杂志. 2003(11)
[10]基于结构的计算机辅助药物设计方法学与应用研究[J]. 宋云龙,陆倍倍,张万年.  药学进展. 2002(06)

博士论文
[1]非编码RNA的二级结构预测与结构化RNA的检测[D]. 徐成振.哈尔滨工程大学 2017
[2]非编码RNA结构预测研究[D]. 赵蕴杰.华中科技大学 2012

硕士论文
[1]无序蛋白质结构预测方法研究[D]. 刘宏伟.苏州大学 2013
[2]原核生物基因识别[D]. 沈志军.河北工业大学 2007



本文编号:3569776

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/3569776.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9dc39***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com