当前位置:主页 > 理工论文 > 生物学论文 >

基于多数据源融合的关键蛋白质识别方法

发布时间:2025-01-09 02:10
  在细胞存活和发育中,关键蛋白质起着不可或缺的作用,可用生物学实验方法和计算方法识别关键蛋白质,前者的优点是能够准确识别关键蛋白质,但是其不足之处是存在耗时、昂贵且效率低下等;后者的优点是能够快速识别关键蛋白质。为了克服生物实验方法的缺点,许多计算方法先后被提出,这些方法基本可以分为两类:基于拓扑的计算方法和融合蛋白质生物信息的计算方法。前者使用蛋白质相互作用网络的拓扑特征,后者使用融合蛋白质复合物等多数据源来识别关键蛋白质。由于蛋白质相互作用数据不完善等原因,导致现有的关键蛋白质识别方法准确率较低,因此如何提高识别精度,仍是具有挑战性的工作。本文基于蛋白质相互作用网络的拓扑特性,融合蛋白质生物信息,提出识别关键蛋白质的PSHC、PSLC有效方法。PSHC是一种基于结构洞理论和蛋白质复合物信息,提出的多数据源融合关键蛋白识别方法。首先,PSHC方法首次把结构洞理论引入到了关键蛋白质识别方法中;其次,融合了蛋白质相互作用网络和蛋白质复合物两种数据源用于识别关键蛋白质。在DIP和Krogan两个蛋白质数据集上的实验结果表明,与其他传统方法相比,PSHC方法可以识别更多关键蛋白质,识别准确率更高...

【文章页数】:53 页

【学位级别】:硕士

【部分图文】:

图3 PSHC与其他方法在DIP数据集上识别正确的关键蛋白质数量

图3 PSHC与其他方法在DIP数据集上识别正确的关键蛋白质数量

对于图3所示的DIP数据集,在前100,200,300,400,500,600个关键蛋白质候选集上,PSHC方法分别识别了80,155,224,277,329,369个关键蛋白质,与其他识别方法相比,PSHC方法识别的关键蛋白质数量最多。当选择前100个作为候选关键蛋白质时,PS....


图2.1MINT数据库

图2.1MINT数据库

山东工商学院硕士学位论文图2.1MINT数据库下载的MITAB格式文件中,第一列信息代表蛋白质A的唯一标识符、第二列信息代表蛋白质B的唯一标识符、第十四列信息代表蛋白质A与蛋白质B之间的相互作用标识符。除此之外,该文件中还包含了许多其他列的信息,例如蛋白质对应的物种、蛋白质对应的....


图3.1结构洞示例图

图3.1结构洞示例图

山东工商学院硕士学位论文图3.1结构洞示例图3.2.2拓扑约束指数根据“中心性-致死性”法则,节点度值的高低反映了对应节点在网络中的影响能力,度值越高,其对应蛋白质越倾向于是关键蛋白质。但相关研究发现,既存在部分度值较高的蛋白质不是关键蛋白质,也存在部分度值较低的蛋白质是关键蛋白....


图3.2拓扑结构图

图3.2拓扑结构图

山东工商学院硕士学位论文图3.2拓扑结构图3.2.3关键蛋白质识别方法PSHC通过拓扑约束指数(SD)和蛋白质复合物的度中心性(IDC)的线性加权组合,提出一种新的方法PSHC。PSHC包含两点:(1)以节点的度和其邻居信息为参数的拓扑关键性指数SD。(2)以蛋白质复合物中蛋白质....



本文编号:4024980

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/swxlw/4024980.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户aaa07***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com