当前位置:主页 > 理工论文 > 生物学论文 >

基于局部特征的蛋白质三维结构相似性研究

发布时间:2021-11-15 23:27
  在生命体中蛋白质是组成一切细胞和组织的重要成分,是生命活动的承担者。已有生物学家证明了蛋白质结构和功能的统一性,即生物功能相似的蛋白质在结构上也是相似的,并且蛋白质的生物功能最终由其三维空间结构决定。因此,研究蛋白质三维结构的相似性对于发掘蛋白质生物功能以及理解生命体发展规律均有重要意义。现有的相关研究主要是基于传统计算的方法来比较蛋白质三维结构,但大多数方法往往容易忽略一些有实际生物意义的特征量,并且没有考虑数据的冗余性,导致计算的相似性不够准确,在计算上也比较耗时,难以满足对未知蛋白质日益增长的研究需求。因此本文在前人研究的工作基础上,将从以下两个方面进行研究:(1)自适应的局部特征频率向量(ALFF)。ALFF是本文提出的一种使用局部特征发生的频率来表示蛋白质的方法,首先可以通过蛋白质C?原子骨架来计算C?距离矩阵,用C?距离矩阵划分出的部分具有代表性的子矩阵表示蛋白质的局部特征,子矩阵的大小m使用OTSU算法根据数据集的特点确定最合适的值,划分出所有可能的子矩阵之后使用Mean Shift算法对所有的子矩阵聚类,... 

【文章来源】:广西大学广西壮族自治区 211工程院校

【文章页数】:71 页

【学位级别】:硕士

【部分图文】:

基于局部特征的蛋白质三维结构相似性研究


PDB蛋白质数量的增长趋势

骨架图,蛋白质,配准,骨架


广西大学硕士学位论文基于局部特征的蛋白质三维结构相似性研究5(,)=min[√1∑‖()‖2](1-1)最小,这种方法称为RMSD方法,是最早提出并且引用最广泛的方法。如果RMSD的计算得到的结果(即两个蛋白质的偏差)为0,说明这两个蛋白质是完全相同的结构;图1-2蛋白质的骨架配准Fig.1-2Thergistrationofproteinbackbone如果结果比较小,则被认为是相似的,实验表明,C原子数量在150个以上的一对蛋白质,如果它们的均方根差结果小于2,则说明这两个蛋白质是相似的[34];其他RMSD的值就分很多种情况解释[35]。显然,RMSD方法有一些局限性:一方面,它的计算结果和两个蛋白质的长度有很大的关系,同样的数值结果对于长度不一样的蛋白质可能代表不一样的相似度。另一方面,由于计算需要任意两个原子逐个匹配,计算量比较大,必要时不得不采取优化手段减少搜索空间[36]。另外,当被比较的蛋白质的局部结构差距比较大时,计算结果受到的影响会比较大,这样的结果忽略了生物学意义[37]。蛋白质的骨架坐标优化配准属于NP难题,这让在大多相似性度量下的结构配准都不一定能保证哪

结构图,蛋白质


广西大学硕士学位论文基于局部特征的蛋白质三维结构相似性研究8可以作为顶点。将集合G=(V,E)表示蛋白质三维拓扑结构时,Graph顶点单元利用二级结构、侧链和原子等氨基酸链形成的空间三维体子结构,关系边代表蛋白质结构内部不同单元间的作用关系。Graph构造完成之后,通过同构分析可以比较蛋白质结构的相似度,分析Graph对应关联矩阵和对应的Laplace矩阵提取蛋白质结构图所包含的不变特征和拓扑一致的聚类信息,并推测出各种功能对应的结构模式,从而推出蛋白质三维结构之间的相似性。Hu等人[48]深入研究了Graph的一种特殊情况,用Graph的“顶点”代表蛋白质链的骨架原子,“边”代表顶点之间是否邻接的关系,把蛋白质结构映射成一个对称的邻接矩阵C,当两个残基i和j邻接的时候,C(i,j)=1;当两个残基i和j不是邻接时,C(i,j)=0。其中,两个i和j残基邻接指的是它们的三维空间距离小于设置的某个阈值,这样邻接矩阵可以较好地帮助识别蛋白质结构中的规则二级结构。Ulavappa等人[49]提出了一种基于Graph划分的方法,将一对蛋白质三维结构转换为2D图(无向加权图),接着把2D图划分为子图,然后将子图与主图进行匹配,最后这些子图将计算匹配蛋白质对之间的相似度,计算过程如图1-3所示,这种方法不仅考虑了键,还考虑了非键原子团簇,在时间复杂度和准确度上比较有效,提供了非键原子存在的相互作用和子图表达二级结构的其他信息。图1-3基于Graph划分子图计算蛋白质相似性Fig.1-3CalculateproteinsimilaritybasedonGraphdividingsub-graphs

【参考文献】:
期刊论文
[1]Otsu阈值分割法特点及其应用分析[J]. 袁小翠,黄志开,马永力,刘宝玲.  南昌工程学院学报. 2019(01)
[2]目标跟踪算法综述[J]. 孟琭,杨旭.  自动化学报. 2019(07)
[3]蛋白质三维结构相似性比较方法综述[J]. 彭群生,胡敏.  计算机辅助设计与图形学学报. 2006(10)

博士论文
[1]蛋白质结构的空间分布特征研究[D]. 胡敏.浙江大学 2008



本文编号:3497713

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/swxlw/3497713.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户bac64***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com