当前位置:主页 > 管理论文 > 统计学论文 >

蛋白质四级结构预测

发布时间:2021-04-25 19:28
  生物信息学的出现极大的推动了生命科学相关学科的发展,对于近年来不断增长的生物相关海量数据提供了相应的解决方案。其中蛋白质结构的研究是生物信息学中的一个热点,通过研究蛋白质的结构能够更好的认清蛋白质的内在机制,了解生命活动的奥秘。蛋白质的结构主要分为四个层级,其中四级结构对于蛋白质大分子来说有着重要意义,近几年相关学者对蛋白质四级结构的预测做了大量的工作,可是预测率仍旧不是非常理想,本文利用不同的特征提取方法以及机器学习算法进行整合,构造出不同的预测器,对蛋白质四级结构完成两层预测,第一层预先对单聚体,同源多聚体,非同源多聚体进行判别,完成之后我通过第二层预测器能够预测出它具体是属于几聚体,本文主要工作如下:(1)构造了一种利用改进的伪氨基酸成分法进行特征提取,结合最近邻算法的预测方法,对比于传统的伪氨基酸成分法整体预测率提高了12.63%,达到了67.81%同时在第二层中部分类别提高了20%预测成功率。(2)我利用Gene Ontology数据库结合现有的结构功能域数据库进行特征提取,利用随机森林方法进行分类,发现比较于之前的研究该方法的整体预测率能够达到74.38%,提高了3.24%... 

【文章来源】:景德镇陶瓷大学江西省

【文章页数】:67 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
1 引言
    1.1 研究背景
    1.2 蛋白质结构类型介绍
        1.2.1 蛋白质一级结构
        1.2.2 蛋白质二级结构
        1.2.3 蛋白质三级结构
        1.2.4 蛋白质四级结构
    1.3 蛋白质结构预测综述
    1.4 蛋白质的四级结构研究现状介绍
2 常见的特征提取方法及分类算法
    2.1 蛋白质特征提取方法
        2.1.1 基于氨基酸的位置组成信息的提取方法
        2.1.2 基于氨基酸物化属性的特征提取方法
        2.1.3 基于蛋白质数据库特征提取算法
        2.1.4 基于蛋白质进化信息的特征提取
    2.2 蛋白质预测问题中的常用分类算法
        2.2.1 支持向量机
        2.2.2 逻辑回归算法
        2.2.3 神经网络模型
    2.3 模型的检验
3 基于改进的伪氨基酸成分蛋白质四级结构预测
    3.1 数据集的构建
    3.2 改进的伪氨基酸成分特征提取方法
    3.3 K近邻算法
    3.4 结果与讨论
4 基于Gene Ontology的蛋白质四级结构预测
    4.1 基于Gene Ontology数据库的蛋白质特征提取
        4.1.1 GO数据库
        4.1.2 蛋白质序列构建
    4.2 随机森林分类器
        4.2.1 决策树
        4.2.2 随机森林
    4.3 结果与讨论
5 基于BP神经网络的蛋白质四级结构预测
    5.1 数据预处理
        5.1.1 正交编码
        5.1.2 PCA数据处理
    5.2 BP神经网络
    5.3 实验过程
    5.4 结果与讨论
6 基于卷积神经网络的蛋白质四级结构预测
    6.1 卷积神经网络原理与结构
        6.1.1 卷积网络的基本原理
        6.1.2 卷积神经网络的内部结构
        6.1.3 激活函数
    6.2 结果与讨论
7 总结
致谢
参考文献
攻读硕士学位期间参与的项目和发表的论文


【参考文献】:
期刊论文
[1]基于支持向量机的蛋白质同源寡聚体分类研究[J]. 张绍武,潘泉,陈润生,张洪才.  生物化学与生物物理进展. 2003(06)



本文编号:3159958

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/3159958.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4007c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com