基于深度学习的蛋白质功能预测研究
发布时间:2021-06-05 06:18
随着生物医学大数据的到来,通过蛋白质组学数据挖掘其潜在的生物学价值,对于研究分子间作用机理、药物设计和人类疾病防治具有重要意义。而利用实验的方法是耗时且耗费资源的,运用计算方法预测蛋白质功能显得尤为重要。随着深度学习的蓬勃发展,通过深度学习预测蛋白质-蛋白质相互作用(ProteinProtein Interactions,PPIs)和药物-靶点相互作用(Drug-Target Interactions,DTIs)已经成为生物信息学的研究热点。本课题基于深度学习预测PPIs和DTIs,主要研究内容如下:1.提出基于集成残差卷积神经网络(Ensemble Residual Convolution Neural Network)的蛋白质-蛋白质相互作用预测方法,称之为EResCNN。首先融合伪氨基酸组成(Pseudo-Amino Acid Composition,PseAAC)、自协方差描述符(Auto Covariance,AC)、伪位置特异性得分矩阵(Pseudo Position-Specific Scoring Matrix,PsePSSM)、分组重量编码(Encoding Base...
【文章来源】:青岛科技大学山东省
【文章页数】:99 页
【学位级别】:硕士
【部分图文】:
蛋白质-蛋白质相互作用三维立体结构图[11],(A)为蛋白质-蛋白质相互作用分子结构示意图,(B)为蛋白质-蛋白质相互作用网络拓扑结构图
青岛科技大学研究生学位论文3分子生物学的发展,研究人员已经设计了一系列可用的公共数据库,如SuperTarget[24]、KEGG[25]、DrugBank[26]和TTD[27]。这些数据库容纳着大量的化合物,但是其与相应蛋白和相关药物之间的相互作用是未知的,药物-靶点相互作用的研究可以减少发现新的候选药物的研究周期,而且对于检测药物重新定位的副作用也至关重要。图1-2药物-靶点相互作用的分子模拟图和药物-靶点相互作用的网络图[28]。(A)为药物-靶点相互作用分子结构示意图,(B)为药物-靶点相互作用网络拓扑结构图。Fig.1-2Molecularsimulationandnetworkfigureofdrug-targetinteractions.(A)isamolecularstructurefigureofdrug-targetinteractions,(B)isatopologyfigureofdrug-targetinteractionsnetwork.自2000年代初以来,深度学习在图像识别、语音识别和翻译等领域受到在学术界和工业界的极大重视[29]。而深度学习具有强大的特征学习及序列和图像数据处理能力,非常适合处理生物医学数据,引起研究人员的广泛关注。深度学习通过模仿大脑结构为输入数据的高效处理提供了新技术和新思路。深度学习的框架包括自编码网络、深度神经网络、深度信念网络、卷积神经网络、循环神经网络、残差神经网络、胶囊神经网络和其它新兴架构。随着计算机硬件提供更多
青岛科技大学研究生学位论文27其中,11(,)ttiiyglyy表示样本的一阶导数,而121(,)ttiiyhlyy表示每个样本二阶导数。2.5深度学习方法深度学习通过逐层非线性映射的方法来识别和学习未知样本的数据分布,输入特征和输出类别之间的隐藏单元可以提供更高级别的抽象信息[120],而且适用于多任务和多目标学习。目前比较流行的深度学习框架包括深度神经网络也称为深度神经网络(DeepNeuralNetwork,DNN)、卷积神经网络(ConvolutionalNeuralNetwork,CNN)循环神经网络(RecurrentNeuralNetwork,RNN)、自编码网络(Autoencodernetwork),如图2-1所示。图2-1四种深度学习框架示意图,包括深度神经网络(A)、卷积神经网络(B)、循环神经网络(C)和自编码网络(D)。Fig.2-1Schematicfiguresoffourdeeplearningframeworks,includingdeepneuralnetwork(A),convolutionalneuralnetwork(B),recurrentneuralnetwork(C),andauto-encodernetwork(D).2.5.1深度神经网络深度神经网络(DeepNeuralNetwork,DNN)是由Hinton等人[121]基于人脑学习的思想提出了一种的机器学习方法,相比较于浅层神经网络,DNN是多层隐藏层组成的框架,将样本空间中的数据映射到一个具有更强解释性的特征空间。DNN中第i层的任意一个神经元与第i1层的任意一个神经元相连,在输入层接收数据,在各个节点中将输入数据与权重相乘,通过非线性激活函数得到输出值,通过计算平均梯度并相应地调整权重和偏置,如图2-1(A)所示。
【参考文献】:
硕士论文
[1]基于多信息融合的蛋白质相互作用预测研究[D]. 吴雪.青岛科技大学 2019
[2]基于机器学习的蛋白质亚线粒体定位预测研究[D]. 邱文莹.青岛科技大学 2019
[3]蛋白质亚细胞定位的机器学习方法及其应用研究[D]. 李珊.青岛科技大学 2018
[4]基于多信息融合的蛋白质结构预测研究[D]. 娄立峰.青岛科技大学 2018
[5]特征选择及其在生物信息处理中的应用研究[D]. 张维健.大连理工大学 2015
[6]基于序列的蛋白质功能预测研究[D]. 黄淑云.南昌大学 2012
[7]蛋白质亚细胞定位的序列编码及预测方法研究[D]. 张丽.湖南大学 2010
本文编号:3211613
【文章来源】:青岛科技大学山东省
【文章页数】:99 页
【学位级别】:硕士
【部分图文】:
蛋白质-蛋白质相互作用三维立体结构图[11],(A)为蛋白质-蛋白质相互作用分子结构示意图,(B)为蛋白质-蛋白质相互作用网络拓扑结构图
青岛科技大学研究生学位论文3分子生物学的发展,研究人员已经设计了一系列可用的公共数据库,如SuperTarget[24]、KEGG[25]、DrugBank[26]和TTD[27]。这些数据库容纳着大量的化合物,但是其与相应蛋白和相关药物之间的相互作用是未知的,药物-靶点相互作用的研究可以减少发现新的候选药物的研究周期,而且对于检测药物重新定位的副作用也至关重要。图1-2药物-靶点相互作用的分子模拟图和药物-靶点相互作用的网络图[28]。(A)为药物-靶点相互作用分子结构示意图,(B)为药物-靶点相互作用网络拓扑结构图。Fig.1-2Molecularsimulationandnetworkfigureofdrug-targetinteractions.(A)isamolecularstructurefigureofdrug-targetinteractions,(B)isatopologyfigureofdrug-targetinteractionsnetwork.自2000年代初以来,深度学习在图像识别、语音识别和翻译等领域受到在学术界和工业界的极大重视[29]。而深度学习具有强大的特征学习及序列和图像数据处理能力,非常适合处理生物医学数据,引起研究人员的广泛关注。深度学习通过模仿大脑结构为输入数据的高效处理提供了新技术和新思路。深度学习的框架包括自编码网络、深度神经网络、深度信念网络、卷积神经网络、循环神经网络、残差神经网络、胶囊神经网络和其它新兴架构。随着计算机硬件提供更多
青岛科技大学研究生学位论文27其中,11(,)ttiiyglyy表示样本的一阶导数,而121(,)ttiiyhlyy表示每个样本二阶导数。2.5深度学习方法深度学习通过逐层非线性映射的方法来识别和学习未知样本的数据分布,输入特征和输出类别之间的隐藏单元可以提供更高级别的抽象信息[120],而且适用于多任务和多目标学习。目前比较流行的深度学习框架包括深度神经网络也称为深度神经网络(DeepNeuralNetwork,DNN)、卷积神经网络(ConvolutionalNeuralNetwork,CNN)循环神经网络(RecurrentNeuralNetwork,RNN)、自编码网络(Autoencodernetwork),如图2-1所示。图2-1四种深度学习框架示意图,包括深度神经网络(A)、卷积神经网络(B)、循环神经网络(C)和自编码网络(D)。Fig.2-1Schematicfiguresoffourdeeplearningframeworks,includingdeepneuralnetwork(A),convolutionalneuralnetwork(B),recurrentneuralnetwork(C),andauto-encodernetwork(D).2.5.1深度神经网络深度神经网络(DeepNeuralNetwork,DNN)是由Hinton等人[121]基于人脑学习的思想提出了一种的机器学习方法,相比较于浅层神经网络,DNN是多层隐藏层组成的框架,将样本空间中的数据映射到一个具有更强解释性的特征空间。DNN中第i层的任意一个神经元与第i1层的任意一个神经元相连,在输入层接收数据,在各个节点中将输入数据与权重相乘,通过非线性激活函数得到输出值,通过计算平均梯度并相应地调整权重和偏置,如图2-1(A)所示。
【参考文献】:
硕士论文
[1]基于多信息融合的蛋白质相互作用预测研究[D]. 吴雪.青岛科技大学 2019
[2]基于机器学习的蛋白质亚线粒体定位预测研究[D]. 邱文莹.青岛科技大学 2019
[3]蛋白质亚细胞定位的机器学习方法及其应用研究[D]. 李珊.青岛科技大学 2018
[4]基于多信息融合的蛋白质结构预测研究[D]. 娄立峰.青岛科技大学 2018
[5]特征选择及其在生物信息处理中的应用研究[D]. 张维健.大连理工大学 2015
[6]基于序列的蛋白质功能预测研究[D]. 黄淑云.南昌大学 2012
[7]蛋白质亚细胞定位的序列编码及预测方法研究[D]. 张丽.湖南大学 2010
本文编号:3211613
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3211613.html