当前位置:主页 > 理工论文 > 生物学论文 >

通过序列信息预测RNA的柔性

发布时间:2022-01-08 17:31
  在很多生物进程中结构柔性发挥了非常重要的作用,它对于蛋白质的催化和变构,RNA催化剂的二级结构形成和折叠以及蛋白质-RNA识别都是必不可少的。B因子可以衡量蛋白质结构或者RNA结构的柔性,预测B因子可以帮助人们理解生物分子的结构和功能。B因子被普遍应用于蛋白质无序区域,蛋白质折叠率,蛋白质活性位点以及蛋白质热稳定性的分析。测定B因子的实验方法需要消耗高昂的时间成本,因此设计预测B因子的算法是一个具有挑战性并且有重要意义的课题。目前已经有很多算法被设计出来预测蛋白质的B因子,但是只有很少的关于RNA的B因子的研究,在本文的方法之前只有两个研究工作。本文基于随机森林算法提出一个新的预测RNA的B因子的方法RNAbval,该方法从给出的RNA序列出发,充分提取RNA的特征集,包括序列的one hot向量表示,序列进化保守性,预测的RNA溶剂可及面积以及预测的RNA二级结构。RNAbval在五折交叉检验上达到皮尔森相关系数0.5904,在第一个独立测试集上皮尔森相关系数为0.6061。与现有的方法RNAflex比较,RNAbval在两个独立测试集上取得了 9.2%~20.5%的突破,说明了本文... 

【文章来源】:南开大学天津市 211工程院校 985工程院校 教育部直属院校

【文章页数】:49 页

【学位级别】:硕士

【文章目录】:
中文摘要
Abstract
第一章 引言
    第一节 RNA基础知识
    第二节 B因子简介
    第三节 课题研究背景和意义
第二章 材料与方法
    第一节 数据集
    第二节 B因子的标准化
    第三节 特征集合
        2.3.1 one hot向量
        2.3.2 序列进化保守性
        2.3.3 RNA溶剂可及面积
        2.3.4 RNA二级结构
        2.3.5 特征归一化和滑窗
    第四节 随机森林算法
        2.4.1 决策树的基本概念
        2.4.2 分类决策树
        2.4.3 回归决策树
        2.4.4 随机森林算法原理
        2.4.5 随机森林算法实现
    第五节 本文用的其他方法
        2.5.1 支持向量机
        2.5.2 岭回归
        2.5.3 全连接神经网络
    第六节 模型评估
        2.6.1 评价指标
        2.6.2 五折交叉检验
第三章 结果与讨论
    第一节 参数优化
        3.1.1 随机森林参数优化
        3.1.2 其他几种算法的参数优化
        3.1.3 随机森林与其他方法的比较
    第二节 特征贡献
        3.2.1 特征贡献
        3.2.2 Henikoff权重的贡献
        3.2.3 RNAsol与RNAsnap的比较
        3.2.4 RNAbval与RNAflex的比较
        3.2.5 Protein-bound RNA与Protein-free RNA的比较
        3.2.6 案例分析
        3.2.7 网页服务器
第四章 结论
参考文献
致谢
个人简历



本文编号:3576979

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/swxlw/3576979.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户19591***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com