基于全卷积神经网络的蛋白质与RNA结合位点图预测
发布时间:2021-02-10 08:45
蛋白质与RNA的相互作用在各种生物过程中都起到了至关重要的作用。基因调控、RNA剪切、RNA降解等生命调控过程均与蛋白质与RNA的结合位点有关。因此分析蛋白质与RNA的结合位点可以深入理解蛋白质与RNA的作用机制,对理解这些生物过程有非常重要的意义。目前已经有很多生物实验的方法对结合位点进行测量,如X射线晶体衍射、核磁共振、CLIP-seq等。上述生物实验的方法均能够准确的获取蛋白质与RNA的结合位点,但是非常耗费人力、物力、财力。随着蛋白质与RNA复合物三维空间数据的增多,研究人员开始通过计算的方法对结合位点进行预测与分析,通常使用蛋白质与RNA复合物的三维结构数据对序列上的结合位点进行预测。目前存在的大部分方法都是基于序列中的氨基酸与核酸对进行分析,忽略了序列整体对结合位点的影响。同时这些方法所使用的数据集都很小,得到的预测结果可能会存在偏向性。针对上述问题,本文进行了如下的工作:(1)重新收集了实验数据,从PDB数据库中收集蛋白质与RNA复合物数据共计1130条。(2)使用了蛋白质共进化信息PSSM矩阵(Position-Specific Scoring Matrix)以及RNA...
【文章来源】:吉林大学吉林省 211工程院校 985工程院校 教育部直属院校
【文章页数】:54 页
【学位级别】:硕士
【部分图文】:
FCN模型示意图
第2章相关知识介绍8化层、上采样层以及跳跃结构进行介绍。卷积层全卷积神经网络中的卷积层由若干卷积核构成,每个卷积核的参数由网络的反向传播计算得来。对于输入数据,卷积核从左至右、从上至下的移动,将卷积核覆盖的每一个位点与卷积核相乘并求和,最终得到该层的输出,卷积的过程如图2.2所示。图2.2卷积示意图卷积层能够提取输入数据的特征,在全卷积神经网络中,随着层数的深入,感受野的增大,更能提取出输入数据的深层特征。池化层池化层(pooling)又被称作下采样层。由于图片数据中相邻的像素点有相关关系,导致卷积层提取出的特征中包含重复的数据,全卷积神经网络中使用池化层去掉多余的特征,可以增大感受野,进一步减少参数,防止网络过拟合。池化方法主要有三种:最大池化(maxpooling)、均值池化(meanpooling)、随机池化(stochasticpooling),其中最大池化使用了局部接域的最大值作为该接受域的输出结果,平均池化使用了局部接域的平均值作为该接受域的输出结果,随机池化通过概率矩阵计算局部接受域的输出结果,图2.3展示了三种池化方法。
第2章相关知识介绍9图2.3三种池化方式上采样层全卷积神经网络中的上采样层是卷积的逆过程,用来放大池化之后的特征图。全卷积神经网络中上采样层使用的方法是双线性插值法,下面将对该方法进行简要介绍。图2.4双线性插值如图2.4所示,已知函数在11=(1,1)、12=(1,2)、21=(2,1)、22=(2,2)的值,若想获得函数在点=(,)的值,则需要进行双线性插值:(,1)≈221(11)+121(21)-------------------(2.1)(,2)≈221(12)+121(22)-------------------(2.2)(,)≈2y21(,1)+121(,2)------------------(2.3)在全卷积神经网络中,可以利用相邻的四个点,完成上采样过程。
【参考文献】:
期刊论文
[1]蛋白质溶液结构及动力学的核磁共振研究[J]. 胡蕴菲,金长文. 波谱学杂志. 2009(02)
本文编号:3027106
【文章来源】:吉林大学吉林省 211工程院校 985工程院校 教育部直属院校
【文章页数】:54 页
【学位级别】:硕士
【部分图文】:
FCN模型示意图
第2章相关知识介绍8化层、上采样层以及跳跃结构进行介绍。卷积层全卷积神经网络中的卷积层由若干卷积核构成,每个卷积核的参数由网络的反向传播计算得来。对于输入数据,卷积核从左至右、从上至下的移动,将卷积核覆盖的每一个位点与卷积核相乘并求和,最终得到该层的输出,卷积的过程如图2.2所示。图2.2卷积示意图卷积层能够提取输入数据的特征,在全卷积神经网络中,随着层数的深入,感受野的增大,更能提取出输入数据的深层特征。池化层池化层(pooling)又被称作下采样层。由于图片数据中相邻的像素点有相关关系,导致卷积层提取出的特征中包含重复的数据,全卷积神经网络中使用池化层去掉多余的特征,可以增大感受野,进一步减少参数,防止网络过拟合。池化方法主要有三种:最大池化(maxpooling)、均值池化(meanpooling)、随机池化(stochasticpooling),其中最大池化使用了局部接域的最大值作为该接受域的输出结果,平均池化使用了局部接域的平均值作为该接受域的输出结果,随机池化通过概率矩阵计算局部接受域的输出结果,图2.3展示了三种池化方法。
第2章相关知识介绍9图2.3三种池化方式上采样层全卷积神经网络中的上采样层是卷积的逆过程,用来放大池化之后的特征图。全卷积神经网络中上采样层使用的方法是双线性插值法,下面将对该方法进行简要介绍。图2.4双线性插值如图2.4所示,已知函数在11=(1,1)、12=(1,2)、21=(2,1)、22=(2,2)的值,若想获得函数在点=(,)的值,则需要进行双线性插值:(,1)≈221(11)+121(21)-------------------(2.1)(,2)≈221(12)+121(22)-------------------(2.2)(,)≈2y21(,1)+121(,2)------------------(2.3)在全卷积神经网络中,可以利用相邻的四个点,完成上采样过程。
【参考文献】:
期刊论文
[1]蛋白质溶液结构及动力学的核磁共振研究[J]. 胡蕴菲,金长文. 波谱学杂志. 2009(02)
本文编号:3027106
本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/3027106.html