融入特征选择的蛋白质功能预测和功能模块发现研究
发布时间:2021-03-23 12:20
人类基因组测序的完成让蛋白质组学研究成为了生命科学的重要领域之一。蛋白质作用参与了人体的各个生命活动,例如遗传物质复制、基因表达控制、代谢等活动都依赖于蛋白质-蛋白质相互作用(PPI)。因此,对PPI网络的研究有助于人们系统地了解其多样的生物学过程,PPI网络在后基因组时代受到越来越多的关注。在如今科技的发展趋势下,高通量技术也在不断完善中,得益于高通量技术的发展提升,越来越多的PPI数据能够被收集起来。然而尽管其中部分蛋白质的功能已经被加以标注,但未被标注功能的蛋白质数目也随着不断被收集的PPI网络数据而日渐扩大。因此如何能够科学高效的标注蛋白质功能成为生物课题研究中的一个重点内容。在目前已经被收集的蛋白质数据中,有相当大一部分的蛋白质的特征信息已经明确,而更多的是仅仅存在于相互作用网络中的蛋白质数据,它们没有其他附加的特征信息来帮助预测功能。对于仅仅存在于相互作用网络中没有其他特征信息的蛋白质,我们无法直接用分类的方法去预测它们的功能,却可以考虑用网络嵌入的方法学习出PPI网络中每个蛋白质数据点的低维表示,并以此作为蛋白质的特征来预测蛋白质功能。而那些具有特征信息的蛋白质,我们可以...
【文章来源】:安徽大学安徽省 211工程院校
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
利用边缘介数对原始PPI网络进行加权Fig3.1weighttheoriginalPPInetworkwithedgebetweenness
第三章基于网络嵌入和特征选择的蛋白质功能预测22(1)算法收敛性分析:这一部分用实验结果证实了目标函数值在优化过程中不断收敛直到趋于稳定,如图3.2所示。图3.2(a)展示了收敛过程中目标函数值的变化趋势。此外,随着迭代次数的平均进动如图3.2(b)所示。(a)(b)图3.2算法目标函数收敛性分析Fig3.2Convergenceanalysisoftheobjectivefunctionofthealgorithm(2)PPI网络的加权低维嵌入表示效果分析:在这一部分,我们将加权PPI网络低维嵌入的数据重构结果与原始PPI数据进行比较。在这里,如3.31章节内容所述,我们将PPI网络的原始二分邻接矩阵和权值邻接矩阵嵌入到相同的维度空间中,实验结果在图3.3中给出。显然,与直接将PPI网络的原始二分邻接矩阵相比,使用权值邻接矩阵来学习网络低维表示的残差更校结果表明,边介数在保持PPI网络结构的有效性,这充分体现了我们的嵌入策略的优越性。并且,在图3.4中,利用边介数构造权值邻接矩阵后学习的PPI网络低维表示(图3.4(b))明显比二分邻接矩阵的低维嵌入结果更加接近(图3.4(a)),这更加证明了使用边介数加权的有效性。
安徽大学硕士学位论文23图3.3两种不同加权PPI网络嵌入表示的残差Fig3.3ResidualoftwodifferentweightedPPInetworkembeddingrepresentations图3.4两种不同加权PPI网络的低维分布Fig3.4Low-dimensionaldistributionsoftwodifferentweightedPPInetworks(3)算法准确性的比较实验结果分析:在这一部分中,我们将所提出的多标签分类模型与目前最先进的几种用于蛋白质功能预测的多标签分类方法的性能进行了比较。我们选择的比较方法如下所述:BP-MLL[39]:这个方法是Zhang等人提出的一个用于多标签学习的反向传播神经网络算法,它是由流行的反向传播算法,通过引入一个新的误差函数去捕获多标签学习的特征。ML-RBF[40]:此方法是在广泛使用的RBF方法的基础上,提出的一种新的多标签神
【参考文献】:
硕士论文
[1]基于流形学习的蛋白质功能预测与优化[D]. 梁华东.安徽大学 2017
本文编号:3095781
【文章来源】:安徽大学安徽省 211工程院校
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
利用边缘介数对原始PPI网络进行加权Fig3.1weighttheoriginalPPInetworkwithedgebetweenness
第三章基于网络嵌入和特征选择的蛋白质功能预测22(1)算法收敛性分析:这一部分用实验结果证实了目标函数值在优化过程中不断收敛直到趋于稳定,如图3.2所示。图3.2(a)展示了收敛过程中目标函数值的变化趋势。此外,随着迭代次数的平均进动如图3.2(b)所示。(a)(b)图3.2算法目标函数收敛性分析Fig3.2Convergenceanalysisoftheobjectivefunctionofthealgorithm(2)PPI网络的加权低维嵌入表示效果分析:在这一部分,我们将加权PPI网络低维嵌入的数据重构结果与原始PPI数据进行比较。在这里,如3.31章节内容所述,我们将PPI网络的原始二分邻接矩阵和权值邻接矩阵嵌入到相同的维度空间中,实验结果在图3.3中给出。显然,与直接将PPI网络的原始二分邻接矩阵相比,使用权值邻接矩阵来学习网络低维表示的残差更校结果表明,边介数在保持PPI网络结构的有效性,这充分体现了我们的嵌入策略的优越性。并且,在图3.4中,利用边介数构造权值邻接矩阵后学习的PPI网络低维表示(图3.4(b))明显比二分邻接矩阵的低维嵌入结果更加接近(图3.4(a)),这更加证明了使用边介数加权的有效性。
安徽大学硕士学位论文23图3.3两种不同加权PPI网络嵌入表示的残差Fig3.3ResidualoftwodifferentweightedPPInetworkembeddingrepresentations图3.4两种不同加权PPI网络的低维分布Fig3.4Low-dimensionaldistributionsoftwodifferentweightedPPInetworks(3)算法准确性的比较实验结果分析:在这一部分中,我们将所提出的多标签分类模型与目前最先进的几种用于蛋白质功能预测的多标签分类方法的性能进行了比较。我们选择的比较方法如下所述:BP-MLL[39]:这个方法是Zhang等人提出的一个用于多标签学习的反向传播神经网络算法,它是由流行的反向传播算法,通过引入一个新的误差函数去捕获多标签学习的特征。ML-RBF[40]:此方法是在广泛使用的RBF方法的基础上,提出的一种新的多标签神
【参考文献】:
硕士论文
[1]基于流形学习的蛋白质功能预测与优化[D]. 梁华东.安徽大学 2017
本文编号:3095781
本文链接:https://www.wllwen.com/kejilunwen/yysx/3095781.html