当前位置:主页 > 理工论文 > 生物学论文 >

基于分组式的多分类器的蛋白质二级结构预测的算法研究

发布时间:2020-07-23 02:29
【摘要】:蛋白质二级结构预测是蛋白质结构预测和理解蛋白质结构和功能的重要课题,主要工作是依据蛋白质氨基酸序列的编码特征正确识别出对应的蛋白质二级结构标签。本文采用25PDB蛋白质序列数据集,采用PSSM编码正交编码和滑动窗口方法将氨基酸处理成伪图像对蛋白质二级结构预测做了研究,在研究过程中选定了三种训练模型,分别是卷积神经网络LSTM神经网络和随机森林。每个训练模型对应一个分组实验,在每个分组实验中对训练模型做了训练模型的优化设计:在基于卷积神经网络的分组实验中,设计了一个包含两个网络结构单元的一般卷积神经网络,每个网络单元包含主要的卷积层和下采样层,因为蛋白质氨基酸的伪图像对于卷积神经网络来说相对于真正的图像而言数据量较少,所以本文设计了一个可以增加输入冗余,解决一般卷积神经网络梯度偏离的残差卷积神经网络,实验证明这种卷积神经网络更加稳定,预测更准确。在基于LSTM神经网络的分组实验中,分别对伪图像在两个维度上切片生成序列数据对于一般的LSTM神经网络做了实验,因为直接切片会破坏蛋白质氨基酸序列的上下文特,所以本文采用滑动窗口操作在蛋白质序列维度生成了多个BP神经网络隐层,将这些BP神经网络隐层神经元的输出当作序列数据输入LSTM神经网络,实验证明添加BP神经网络隐层的LSTM神经网络能更好的提取蛋白质序列的上下文特征。在基于随机森林的分组实验中,本文将残差卷积神经网络在最后一个平均池化层提取的样本特征作为随机森林的输入,相当于为随机森林做了一个特征提取器,实验证明添加了特征提取器的随机森林预测结果会有很大提升。在分组实验结束之后,本文利用ensemble方法将实验中三种优化设计之后的模型进行了整合,将残差卷积神经网络加入了BP神经网络隐层的LSTM神经网络和添加了特征提取器的随机森林模型在每个蛋白质二级标签上的输出概率相加,取最大概率对应的标签作为ensemble模型的输出,实验证明ensemble模型相对于三类成员模型的预测结果均有提高。
【学位授予单位】:齐鲁工业大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP18;Q518.1

【相似文献】

相关期刊论文 前10条

1 连云涓;熊惠霖;;蛋白质二级结构预测的多核学习方法[J];计算机应用;2013年S1期

2 何建川;邵阳;张波;;蛋白质和变性蛋白质二级结构的FTIR分析进展[J];化学研究与应用;2012年08期

3 孟翔燕;孟军;葛家麒;;基于遗传算法的蛋白质二级结构预测方法研究进展[J];农机化研究;2009年05期

4 孟翔燕;孟军;葛家麒;;基于混合并行遗传算法的蛋白质二级结构预测[J];农机化研究;2009年06期

5 李元乐;陶兰;;基于小波核支持向量机的蛋白质二级结构预测[J];深圳大学学报;2006年02期

6 董启文,王晓龙,林磊,关毅,赵健;蛋白质二级结构预测:基于词条的最大熵马尔科夫方法[J];中国科学C辑:生命科学;2005年01期

7 孙海军,阮晓钢;用多模神经网络预测蛋白质二级结构[J];昆明理工大学学报(理工版);2004年05期

8 张海霞,唐焕文,张立震,靳利霞,唐一源;蛋白质二级结构预测方法的评价[J];计算机与应用化学;2003年06期

9 王鹏良,江寿平,来鲁华,徐小杰,罗宇;蛋白质二级结构预测的综合分析[J];物理化学学报;1990年06期

10 罗辽复;氨基酸突变及其对蛋白质二级结构的影响[J];郑州轻工业学院学报;1988年02期

相关会议论文 前10条

1 王守源;李晓琴;罗辽复;;氨基酸分类与蛋白质二级结构相关性[A];第九次全国生物物理大会学术会议论文摘要集[C];2002年

2 陈明杰;王焕峰;刘伟;;基于基团编码的蛋白质二级结构预测[A];中国化学会第26届学术年会化学信息学与化学计量学分会场论文集[C];2008年

3 孙素琴;周群;胡鑫尧;卢为琴;高鸿锦;吴斌;卞为东;谢莱军;;多种红外采样技术与计算机辅助解析研究各种蛋白质二级结构的变性机制[A];中国分析测试协会科学技术奖发展回顾[C];2015年

4 杨惠云;田心;;神经网络预测蛋白质二级结构的研究[A];天津市生物医学工程学会2007年学术年会论文摘要集[C];2007年

5 罗三华;黄建华;邱建丁;;小波支持向量机在蛋白质二级结构分类预测中应用[A];中国化学会第26届学术年会化学信息学与化学计量学分会场论文集[C];2008年

6 丛培盛;王志恒;王思聪;李通化;;基于SPSSM的蛋白质二级结构预测进展[A];中国化学会第29届学术年会摘要集——第19分会:化学信息学与化学计量学[C];2014年

7 宋亮;张剑;王先明;温继敏;陈海波;姚端正;蒋昌忠;;人工神经网络预测蛋白质结构的探讨[A];湖北省物理学会、武汉物理学会成立70周年庆典暨2002年学术年会论文集[C];2002年

8 孙向东;黄日波;;运用SVMs原理预测蛋白质二级结构研究[A];广西微生物学会2003年学术年会论文集[C];2003年

9 翁羽翔;;蛋白质动态结构的脉冲升温-时间分辨中红外光谱研究[A];第一届全国生物物理化学会议暨生物物理化学发展战略研讨会论文摘要集[C];2010年

10 王靖;郭晨;梁向峰;郑丽丽;陈澍;马俊鹤;刘会洲;;阳离子表面活性剂CTAB对蛋白质二级结构的影响[A];第十四届全国分子光谱学术会议论文集[C];2006年

相关博士学位论文 前10条

1 贾孟文;mRNA序列、结构、能量和蛋白质二级结构的相关性[D];内蒙古大学;2004年

2 王勇献;蛋白质二级结构预测的模型与方法研究[D];国防科学技术大学;2004年

3 石鸥燕;蛋白质结构预测模型的研究[D];天津医科大学;2008年

4 李明辉;基于机器学习的蛋白质二级结构和相互作用预测[D];哈尔滨工业大学;2007年

5 曹晨;蛋白质二级结构指定和功能分析[D];吉林大学;2016年

6 王艳春;基于GEP和ANN的蛋白质二级结构预测方法研究[D];西北农林科技大学;2009年

7 刘君;融合计算智能的蛋白质结构预测研究[D];重庆大学;2011年

8 吴黎明;蜂王浆新鲜度指标和评价方法研究[D];浙江大学;2008年

9 张胜利;蛋白质与RNA中的若干问题研究[D];大连理工大学;2011年

10 赵裕众;生物序列分析算法的研究及其应用[D];中国科学技术大学;2010年

相关硕士学位论文 前10条

1 王剑;基于分组式的多分类器的蛋白质二级结构预测的算法研究[D];齐鲁工业大学;2019年

2 王蕾蕾;基于条件随机场与深度学习的蛋白质二级结构预测[D];齐鲁工业大学;2019年

3 刘柏丽;蛋白质二级结构预测PSIPRED方法的改进及其应用[D];湖南大学;2014年

4 赵志山;基于深度学习的蛋白质二级结构预测研究[D];哈尔滨工业大学;2018年

5 常菁;用于蛋白质二级结构设计的深度生成模型的研究与应用[D];北京交通大学;2018年

6 常方雷;基于深度学习的蛋白质二级结构预测模型研究[D];天津大学;2018年

7 李维鹏;基于HMM的蛋白质二级结构预测分析[D];云南大学;2017年

8 张帅燕;基于卷积神经网络的蛋白质二级结构预测[D];齐鲁工业大学;2018年

9 候飞翔;基于对偶四元数特征融合的蛋白质二级结构检测方法[D];燕山大学;2018年

10 吴辉;利用序列信息预测蛋白质二级结构的深度学习模型研究[D];天津大学;2017年



本文编号:2766725

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/swxlw/2766725.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户87ee5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com