基于粒度计算的蛋白质磷酸化位点预测算法研究
发布时间:2021-02-23 02:57
蛋白质磷酸化是一种广泛存在于真核生物中的翻译后修饰过程。它在能量代谢、信号传导途径、神经活动、细胞周期和凋亡等多种生物过程中起着重要作用。质谱分析法等传统生物实验的成本较高,因此基于计算方法的磷酸化位点预测成为有效的替代手段。其中无需激酶信息,仅需残基序列作为输入进行预测的非激酶特异性计算方法的需求最广。然而这种计算方法往往对训练数据做了不同的数据压缩策略(如随机采样),降低大数据量所带来的复杂度,以提高训练效率。这些数据压缩做法会导致部分样本原始分布特征损失。此外,对磷酸化位点数据库中未标记的残基位点直接当负样本参与算法的训练也是不科学的。因此,如何解决以上问题,设计有效的算法预测未知的磷酸化位点是有意义的研究领域。基于上述研究问题,本文提出两种非激酶特异性磷酸化位点预测算法。(1)基于核模糊C均值聚类支持向量机的磷酸化位点预测算法。在粒度计算的基础上,该算法结合核模糊C均值聚类,在高维特征空间中划分粒子,获得代表整个样本空间的平衡信息粒。然后在平衡信息粒的基础上,建立了粒度支持向量机预测模型KFCC-GSVM。该模型提高了磷酸化位点数据压缩的合理性和可靠性,使得在应用传统的支持向量...
【文章来源】:广西大学广西壮族自治区 211工程院校
【文章页数】:76 页
【学位级别】:硕士
【部分图文】:
蛋白质磷酸化和去磷酸化示意图
图2-1粒度支持向量机GSVM和SVM通用性能比较
广西大学硕士学位论文基于粒度计算的蛋白质磷酸化位点预测算法研究22图2-2基于两步走策略的LPU方法Fig.2-2LPUmethodbasedontwo-stepstrategy2.6本章小结本章首先介绍了两种磷酸化位点数据库P.ELM和PhosPhAt,其中P.ELM为真核动物磷酸化位点数据库,PhosPhAt为植物磷酸化位点数据库。然后介绍了粒度计算的基本知识、数学模型与粒度支持向量机,接着介绍了模糊聚类的基本知识与本文第三章所用的核模糊C均值聚类算法。最后对正-未标记样本学习算法做了简要说明,为第四章的算法设计与实验过程做了良好铺垫。
本文编号:3046909
【文章来源】:广西大学广西壮族自治区 211工程院校
【文章页数】:76 页
【学位级别】:硕士
【部分图文】:
蛋白质磷酸化和去磷酸化示意图
图2-1粒度支持向量机GSVM和SVM通用性能比较
广西大学硕士学位论文基于粒度计算的蛋白质磷酸化位点预测算法研究22图2-2基于两步走策略的LPU方法Fig.2-2LPUmethodbasedontwo-stepstrategy2.6本章小结本章首先介绍了两种磷酸化位点数据库P.ELM和PhosPhAt,其中P.ELM为真核动物磷酸化位点数据库,PhosPhAt为植物磷酸化位点数据库。然后介绍了粒度计算的基本知识、数学模型与粒度支持向量机,接着介绍了模糊聚类的基本知识与本文第三章所用的核模糊C均值聚类算法。最后对正-未标记样本学习算法做了简要说明,为第四章的算法设计与实验过程做了良好铺垫。
本文编号:3046909
本文链接:https://www.wllwen.com/projectlw/swxlw/3046909.html
教材专著