基于ResNet与DenseNet的蛋白质接触图预测研究
发布时间:2024-05-25 13:17
随着蛋白质测序技术的不断向前发展,蛋白质序列的数量在蛋白质数据库中呈现指数型的增长。由于通过生物实验来确定蛋白质结构的方法不能满足目前的研究需求,因此研究和预测蛋白质接触图是一个非常有效的方法。另外蛋白质接触图的研究和预测不仅有助于对蛋白质结构的研究,还有助于对蛋白质功能的研究,已成为蛋白质三维结构建模的重要工具。本文采用深度神经网络的框架对蛋白质接触图进行预测,具体研究工作如下:(1)在数据提取方面,考虑到序列信息在生物信息学中的重要作用,本文提取了蛋白质序列的二级结构以及溶剂可及性,用于扩充特征;另外,多序列比对在蛋白质接触图中的主要作用是能够提供一种包含序列信息的特征,本文使用HHblits生成较为准确的多序列比对,并用于生成PSSM与PSFM特征;最后本文从进化耦合分析方法中提取成对特征,并与前述特征相结合。(2)本文构建了一种ResNet和DenseNet相结合的深度神经网络框架用于蛋白质接触图预测,并且使用了全新的特征集合。该框架使用一维的ResNet处理由多序列比对生成的序列特征(包括PSSM、Secondary Structure、Solvent Accessibili...
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
本文编号:3982165
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
图1.1?1990-2019年PDB蛋白质数据库蛋白质数量增长图??
与DenseNet的蛋白质接触图预测研究??180000?-j??160000?■蛋白质总数量:??]4〇〇〇〇?■已知结构的蛋白质数量??^?120000????100000?■??^?80000??^?60000??栽?40000?,?_||??20000?;?Ll?L?i?....
图2.1蛋白质接触图??
的定义。它们指出蛋白质接触图l3]中的接触是指两个残基的P碳原子(甘氨酸为a??碳原子)之间的欧式距离小于8A。接触可以分为三种类别:1)长接触:两个残基??之间的距离大于24个残基;2)中接触:两个残基之间的距离在12?23个残基之??间;3)短接触:两个残基之间的距离在6?1....
图2.3?HHblits生成MSA流程图??
蛋白质接触图预测研究??骤为:第一,用提交的序列在数据库中进行搜索;第二,对初始的结果进行多序??列比对,构建初始PSSM;第三,用PSSM作为查询序列,搜索数据库,发现较??远的相似性序列,并给出E-value;第四,构建新的PSSM,重复步骤3。这个过??程不断迭代,直到没有....
图2.4?sigmoid函数图??
浙江理工大学硕士学位论文?基于ResNet与DenseNet的蛋白质接触图预测研究??2.3.1激活函数??激活函数是深度神经网络的重要组成部分,其主要是为神经网络模型引入非??线性的特性,使网络模型具有非线性的建模能力。目前常用的激活函数有sigmoid??函数、tanh函数、....
本文编号:3982165
本文链接:https://www.wllwen.com/projectlw/swxlw/3982165.html
教材专著