基于异构网络的激酶—底物关系预测算法研究
发布时间:2020-05-15 07:08
【摘要】:蛋白质磷酸化是一种重要的蛋白质翻译后修饰,是生物体内一种最基本、最普遍也是最重要的调节方式。其在细胞新陈代谢,基因表达,细胞信号转导等生物过程中起着非常重要的作用。传统的实验方法鉴定磷酸化位点需要花费较大的时间和人力,成本十分高昂。随着高通量技术的快速发展,积累了大量的磷酸化数据。发展高效的计算方法分析和挖掘数据潜在的规律,对磷酸化修饰进行预测,为生物实验提供辅助信息,有利于推动磷酸化蛋白质组学的发展。现有的计算方法大多根据蛋白质底物氨基酸序列的局部信息进行预测,而蛋白质磷酸化作用是一个复杂的生物学过程,不仅仅与单一的底物局部序列有关,往往也与其他关联信息相关。本文通过构建激酶-底物关系网络,并结合蛋白质互作网络(PPI)及其他相似性网络,充分考虑网络拓扑结构信息,对未知激酶-底物的磷酸化关系进行有效预测。本文主要的研究内容如下:第一,基于双向随机游走的激酶-底物关系预测算法。首先通过PPI网络信息,计算激酶相似性和底物相似性。然后利用ClusterONE聚类算法分别对激酶相似性网络和底物相似性网络进行聚类,根据聚类结果对相似性进行调整。随后将已知的关联数据进行整合,构建激酶-底物异构网络,并采用双向随机游走算法(Bi-random Walk)对激酶-底物关系进行预测。通过十折交叉验证与其他预测算法进行比较,实验结果表明该算法表现出了较高的预测性能。此外,相关数据库和科学文献验证了本算法对激酶-底物关系预测的有效性。第二,基于矩阵补全的激酶-底物关系预测算法。由于实验技术的限制,在现有的磷酸化数据中仅有一小部分激酶和底物关系是已知的,而存在大量的缺失关联信息。为了解决这些激酶-底物关联信息的缺失问题,我们提出了基于矩阵补全的激酶-底物关系预测算法。首先通过氨基酸序列的局部比对计算出激酶和底物的相似性矩阵,然后根据相似性对原始的关系网络进行调整,并构建激酶-底物异构网络邻接矩阵,最后采用矩阵补全(Matrix Completion)对异构网络邻接矩阵中的缺失信息进行填充,对潜在的激酶-底物关系进行预测。采用十折交叉验证并得到ROC曲线来评价算法的性能。实验表明:与其他预测算法相比,该算法对激酶-底物关系的预测更为准确有效。此外,在案例分析实验中,验证了该算法对潜在的激酶-底物关系预测的有效性。
【图文】:
该数据库一共收集了邋20279个蛋白质,415466个非冗余的翻译后修饰位点数据,这些数逡逑据主要来源于己被生物实验验证得到的数据,数据覆盖了人类、老鼠等多个物种。在该逡逑数据库网站上提供了在线检索功能,,如图2-1所示,研宄人员可以根据蛋白质名、蛋白逡逑质类型、位点信息、蛋白质结构域、生物学功能等多种来检索和过滤相关信息
%煎义希常埃樱遥卞义贤迹玻村澹校校赏缈墒踊义希疲椋纾澹玻村澹校校慑澹睿澹簦鳎铮颍脲澹觯椋螅酰幔欤椋幔簦椋铮铄义洗送猓朔奖闶莘治鲇肟蒲а芯浚桑睿祝澹猓撸桑吞峁┝隋澹裕幔夥指粑谋荆校校墒菁义衔募T冢桑睿祝澹猓撸桑褪菘庵校恳桓龅鞍字首饔枚灾涠加幸桓鲋眯哦确种担ǎ茫铮睿妫椋洌澹睿悖邋义希樱悖铮颍澹飧龇种凳歉莶煌霭嫖锛涞脑傧中岳创蚍值模种翟礁撸硎菊饬礁龅鞍族义现手涞淖饔霉叵翟浇裘堋e义希保冲义
本文编号:2664659
【图文】:
该数据库一共收集了邋20279个蛋白质,415466个非冗余的翻译后修饰位点数据,这些数逡逑据主要来源于己被生物实验验证得到的数据,数据覆盖了人类、老鼠等多个物种。在该逡逑数据库网站上提供了在线检索功能,,如图2-1所示,研宄人员可以根据蛋白质名、蛋白逡逑质类型、位点信息、蛋白质结构域、生物学功能等多种来检索和过滤相关信息
%煎义希常埃樱遥卞义贤迹玻村澹校校赏缈墒踊义希疲椋纾澹玻村澹校校慑澹睿澹簦鳎铮颍脲澹觯椋螅酰幔欤椋幔簦椋铮铄义洗送猓朔奖闶莘治鲇肟蒲а芯浚桑睿祝澹猓撸桑吞峁┝隋澹裕幔夥指粑谋荆校校墒菁义衔募T冢桑睿祝澹猓撸桑褪菘庵校恳桓龅鞍字首饔枚灾涠加幸桓鲋眯哦确种担ǎ茫铮睿妫椋洌澹睿悖邋义希樱悖铮颍澹飧龇种凳歉莶煌霭嫖锛涞脑傧中岳创蚍值模种翟礁撸硎菊饬礁龅鞍族义现手涞淖饔霉叵翟浇裘堋e义希保冲义
本文编号:2664659
本文链接:https://www.wllwen.com/kejilunwen/yysx/2664659.html