当前位置:主页 > 理工论文 > 生物学论文 >

基于SCOP拓扑结构的蛋白质远同源性检测与折叠识别

发布时间:2021-09-08 07:59
  蛋白质折叠识别和远同源性检测是生物信息学领域中的两个基础问题。通过蛋白质的序列信息来准确的预测蛋白质的远同源物和折叠类别,对蛋白质的功能结构研究以及新型药物的精准设计有着重要作用。本研究中,蛋白质的序列检测问题被视为检索任务,旨在找到与未知查询蛋白高度相关的已知功能结构的蛋白质序列,进而推断未知蛋白质的功能结构。传统基于序列比对的蛋白质远同源检测方法对于序列相似度较低的蛋白质检测性能一般,虽然目前出现了一些机器学习方法来解决这个问题,但对特征的质量依赖较强。而构建蛋白质相似性网络可以进一步提高检测性能,但其十分依赖基排序方法的性能。针对以上问题,本研究通过融合特征到学习排序方法中来提高基排序结果的性能,并构建了基于SCOP拓扑结构的蛋白质相似性网络。最后,将两者融合起来提出了Prot Dec-LTR4.0方法。在SCOP基准数据集上的测试结果表明,该方法能够有效地提高蛋白质远同源性检测性能。虽然排序融合策略在解决蛋白质远同源性检测方面取得了成功。但是折叠识别问题因为序列相似度较低,导致基排序的正样本覆盖率性能一般,获得的特征存在大量缺失现象。针对这个问题,本研究提出了基于SCOP拓扑结... 

【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校

【文章页数】:62 页

【学位级别】:硕士

【部分图文】:

基于SCOP拓扑结构的蛋白质远同源性检测与折叠识别


SCOP数据集拓扑结构形式与主要涉及问题示意图[12]

蛋白质,同源性,内容,方法


哈尔滨工业大学工学硕士学位论文-7-研究;三是基于三元闭包网络的蛋白质折叠识别方法的研究。三个章节之间的数据之间的序列相似度也依次更低,问题研究难度也依次递增。因此本课题主要从三个方面来展开研究,主要研究内容见图1-2。具体介绍如下:图1-2本文研究内容(1)基于排序网络的蛋白质远同源性检测方法的研究。在该方法研究中,提出了三种用于蛋白质对之间的相似度度量方法,将单序列的特征映射成双序列比对特征。然后基于SCOP拓扑结构构建了蛋白质的相似性网络并进行了优化,实现了对排序结果进行重排序,最后,将学习排序算法与网络传播算法融合一起提出了名叫Protdec-LTR4.0的蛋白质远程同源检测方法。通过在SCOP基准数据集的进行性能评估测试和结果显著性分析,表明本章节提出的方法有效的提高了蛋白质远同源性检测的性能。(2)基于序列谱信息的蛋白质折叠识识别方法的研究。基于序列谱的特征因其包含了蛋白质的进化信息,使得其在比对算法中比直接序列对的方法得了更好的效果。本章研究中,通过将多种不同基于序列谱的方法提取的特征融合一起,从而达到多种方法相互增益的目的。针对折叠识别问题中蛋白质之间序列相似度较低,导致部分蛋白质对无法被命中,从而产生的特征缺失和部分特征维度缺失问题,分别提出了特征扩展和特征转换策略来解决这个问题。最终,结合支持向量机分类器提出了Fold-LTR-SVM的方法。在两个基于SCOP拓扑结构划分的折叠识别基准数据集上的实验结果表明,Fold-LTR-SVM方法可以有效提高预测性能。(3)基于三元闭包的蛋白质折叠识别方法的研究。基于SCOP数据集构建的LE基准数据集在折叠识别问题研究中有着广泛的应用。相同折叠的不同超家族蛋白质序列之间的相似度一般都低于25%。数据之间的相似度较低,

示意图,方法,示意图,排序方法


哈尔滨工业大学工学硕士学位论文-11-算法[42]构建蛋白质相似网络来提高查询反馈结果的准确性。在本研究中,将学习排序算法、PageRank和HITS结合一起,提出了ProtDec-LTR4.0方法,进一步提高了排序结果的准确性。ProtDec-LTR4.0方法的示意图如图2-1所示:图2-1ProtDec-LTR4.0方法示意图2.4.特征工程2.4.1多种序列特征提取策略介绍在本研究中,三种最先进的蛋白质检测排序方法(PSI-BLAST[30]、Hmmer[36]和HHblits[37])被作为基排序方法。这三种基排序方法被用来提取基于序列比对打分的特征。这些方法是互补的,因为它们基于不同的技术和

【参考文献】:
期刊论文
[1]蛋白质组学在医学研究中的应用与进展[J]. 李玉香,戎浩,胡群英,李文华.  中国组织工程研究. 2016(33)
[2]基于同源基因的病原菌鉴定和分型靶位点的功能基因组学研究[J]. 杜鹏程,张雯,刘翟,陈晨.  中国科学:生命科学. 2011(08)
[3]生物信息学的现状与展望[J]. 张春霆.  世界科技研究与发展. 2000(06)

硕士论文
[1]基于序列谱的蛋白质折叠识别和远同源性检测[D]. 郭明月.哈尔滨工业大学 2018



本文编号:3390427

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/swxlw/3390427.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4c141***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com