基于集成学习的膜蛋白金属离子结合位点预测
发布时间:2023-03-24 00:09
蛋白质结构预测一直是近几年计算生物学领域的热门问题,我们可以通过了解蛋白质的相应结构,从而推断出其具有的功能并加以运用。不同功能的蛋白质可以与不同种类的化合物发生结合并构成结合蛋白质,这些化合物包括金属离子,核酸和磷酸等等。本文所研究的问题就是结合蛋白质中可以与金属离子结合的一类,即金属蛋白(metalloprotein)。超过1/3的蛋白质可以与金属离子结合以达到相应的结构和功能,因此确定蛋白序列中金属离子结合位点的位置对于理解蛋白质的生物功能有着十分重要的作用。传统使用生物实验的方法来测定结合位点位置的方式对于时间和经济的花费是非常巨大的,很难满足大规模的应用。因此采用计算方法来预测结合位点的信息有着很好的应用前景,可以对蛋白质结构的研究提供帮助。膜蛋白作为生物膜与外界进行物质交换的通道和载体,对于维持生物膜结构的稳定及实现生物膜的物质转运具有很重要的意义。通过预测膜蛋白序列上的金属离子结合位点,能够对膜蛋白结构—功能之间的关系有更深的理解。本文基于膜蛋白的序列信息对六种金属离子结合位点进行预测,包括2,2,,2,以...
【文章页数】:42 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景
1.2 国内外研究现状
1.3 本文主要研究内容
第二章 数据集的构建
2.1 Protein Data Bank(PDB)数据库
2.2 UniProt数据库
2.3 数据集的生成
第三章 特征选取及特征提取
3.1 特征选取
3.2 拓扑结构特征提取
3.3 进化保守性特征提取
3.4 协同进化性特征提取
3.5 溶剂可及性特征提取
3.6 小结
第四章 分类器选择
4.1 分类器简介
4.2 支持向量机
4.3 随机森林
4.4 集成学习算法
4.5 算法步骤
第五章 结果和讨论
5.1 对预测结果的评价指标
5.2 特征有效性分析
5.3 支持向量机参数优化及决断阈值选取
5.3.1 基于网格搜索的参数优化
5.3.2 决断阈值的选择
5.4 基于网格搜索的随机森林参数优化
5.5 训练集抽样次数的选取和集成学习分类器的构建
5.6 单一种类分类器与集成学习分类器的性能比较
5.7 预测方法整体性能评估及与S-SITE的对比
第六章 总结与展望
参考文献
致谢
在学期间公开发表论文及著作情况
本文编号:3769035
【文章页数】:42 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景
1.2 国内外研究现状
1.3 本文主要研究内容
第二章 数据集的构建
2.1 Protein Data Bank(PDB)数据库
2.2 UniProt数据库
2.3 数据集的生成
第三章 特征选取及特征提取
3.1 特征选取
3.2 拓扑结构特征提取
3.3 进化保守性特征提取
3.4 协同进化性特征提取
3.5 溶剂可及性特征提取
3.6 小结
第四章 分类器选择
4.1 分类器简介
4.2 支持向量机
4.3 随机森林
4.4 集成学习算法
4.5 算法步骤
第五章 结果和讨论
5.1 对预测结果的评价指标
5.2 特征有效性分析
5.3 支持向量机参数优化及决断阈值选取
5.3.1 基于网格搜索的参数优化
5.3.2 决断阈值的选择
5.4 基于网格搜索的随机森林参数优化
5.5 训练集抽样次数的选取和集成学习分类器的构建
5.6 单一种类分类器与集成学习分类器的性能比较
5.7 预测方法整体性能评估及与S-SITE的对比
第六章 总结与展望
参考文献
致谢
在学期间公开发表论文及著作情况
本文编号:3769035
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3769035.html