基于深度学习的采样技术在蛋白质结构预测中运用
本文关键词:基于深度学习的采样技术在蛋白质结构预测中运用,由笔耕文化传播整理发布。
【摘要】:蛋白质结构预测指的是:已知氨基酸序列,通过计算的手段预测蛋白质空间三维结构。作为生化实验的一种补充手段,结构预测能够帮助我们在实验结构未知的情况下了解和利用蛋白质的生化功能。目前,蛋白质结构预测的一大瓶颈在于构象的采样。所谓的采样是指在蛋白质的构象空间中生成最小自由能的构象。本文旨在采用深度学习技术研发一种新的采样技术,帮助蛋白质结构预测。传统的采样方法是对自由度直接赋值。这种方法在处理较少的残基时能取得好的效果。但是对于包含100个残基以上的蛋白质结构,由于构象空间的急剧增长,难以得到理想的结构。本文引入深度学习中的混合蒙特卡罗采样方法,以概率分布为依据对蛋白质的自由度进行采样,能够对包含100、200甚至更多个残基的蛋白质结构进行采样。并且,在采样的过程中加入残基间的距离约束,使得一个结构中,最多有75%(平均40%)的残基对得到优化,满足距离约束。能量函数是采样方法的基础依据。本文引入深度学习中的卷积神经网络,通过改进网络结构,让其能够学习蛋白质结构中原子之间的相互作用关系。然后,在多层网络的学习的基础上,用其做回归运算,能够准确的预测蛋白质结构的GDT-Score,在实验中和标准GDT-Score的误差仅在0.002左右。
【关键词】:蛋白质 结构预测 采样 混合蒙特卡罗 卷积神经网络
【学位授予单位】:苏州大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:Q51;TP181
【目录】:
- 摘要4-5
- Abstract5-12
- 第一章 引言12-19
- 1.1 研究背景12-15
- 1.1.1 蛋白质结构预测12-14
- 1.1.2 采样和带约束的采样14
- 1.1.3 深度学习的应用14-15
- 1.2 研究内容15-16
- 1.3 研究意义16-17
- 1.4 本文组织结构17-19
- 第二章 蛋白质结构预测中的采样技术19-32
- 2.1 结构预测与采样19-25
- 2.1.1 蛋白质结构19-23
- 2.1.2 蛋白质结构的计算表达23-24
- 2.1.3 采样和能量函数24-25
- 2.2 Rosetta采样25-26
- 2.2.1 两个主要阶段25-26
- 2.2.2 蒙特卡罗最小化26
- 2.3 I-TASSER采样26-28
- 2.3.1 I-TASSER中蛋白质构象的表达26-27
- 2.3.2 构象的采样27-28
- 2.3.3 副本交换蒙特卡罗(REMC)28
- 2.4 QUARK采样28-31
- 2.4.1 QUARK对自由度的改进29-30
- 2.4.2 QUARK对构象采样的改进30-31
- 2.4.3 其它方面的改进31
- 2.5 本章小结31-32
- 第三章 基于CNN的蛋白质结构打分函数32-48
- 3.1 卷积神经网络32-35
- 3.1.1 稀疏连接32-33
- 3.1.2 权值共享33-34
- 3.1.3 CNN网络结构34-35
- 3.2 材料与方法35-41
- 3.2.1 GDT-Score35
- 3.2.2 数据集35-38
- 3.2.3 模型和训练38-41
- 3.3 实验结果分析41-46
- 3.3.1 超参数选择实验41-44
- 3.3.2 GDT-Score预测实验44-46
- 3.4 本章小结46-48
- 第四章 基于距离约束的HMC采样48-67
- 4.1 HMC采样48-51
- 4.1.1 Hamiltonian动力学49
- 4.1.2 Leap-Frog算法49
- 4.1.3 Metropolis判定49-50
- 4.1.4 在蛋白质结构预测中的运用50-51
- 4.2 距离约束51
- 4.3 材料与方法51-58
- 4.3.1 数据准备51-53
- 4.3.2 模型构建53-55
- 4.3.3 实验流程55-58
- 4.4 实验结果与分析58-65
- 4.4.1 残基对优化58-62
- 4.4.2 结构优化62-65
- 4.4.3 结果讨论65
- 4.5 本章小结65-67
- 第五章 总结与展望67-69
- 5.1 工作总结67
- 5.2 研究展望67-69
- 参考文献69-78
- 发表文章目录及科研项目78-79
- 致谢79-80
【相似文献】
中国期刊全文数据库 前10条
1 林治华;蛋白质结构预测的方法学评述[J];免疫学杂志;2001年S1期
2 靳利霞,唐焕文;蛋白质结构预测方法简述[J];自然杂志;2001年04期
3 殷志祥;蛋白质结构预测方法的研究进展[J];计算机工程与应用;2004年20期
4 史晓红,刘文斌,王燕,罗亮,许进;图论方法研究蛋白质结构预测问题[J];生物技术;2005年05期
5 孙侠;殷志祥;;蛋白质结构预测的理论方法及阶段[J];生物学杂志;2007年01期
6 刘云玲;陶兰;;蛋白质结构预测方法探析[J];生物信息学;2007年04期
7 王俊;邢丽丽;周鹏;;蛋白质结构预测方法研究[J];黑龙江科技信息;2008年19期
8 李明;苏显中;于敏;郑全喜;;蛋白质结构预测研究进展[J];生物技术;2009年03期
9 倪红春,王翼飞,史定华;遗传算法在蛋白质结构预测中的应用[J];上海大学学报(自然科学版);2001年03期
10 靳利霞,唐焕文;模拟退火算法的一种改进及其在蛋白质结构预测中的应用[J];系统工程理论与实践;2002年09期
中国重要会议论文全文数据库 前4条
1 靳利霞;唐焕文;;基于能量极小化的蛋白质结构预测[A];中国运筹学会第六届学术交流会论文集(上卷)[C];2000年
2 朱永锋;崔光照;;基于构象空间退火算法的蛋白质结构预测[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(上册)[C];2004年
3 张红娟;唐焕文;;蛋白质结构预测中的长短程作用分析与研究[A];大连理工大学生物医学工程学术论文集(第2卷)[C];2005年
4 桑延超;彭志红;李谦;;PSO-GA协同优化算法及其在蛋白质结构预测中的应用[A];2007年中国智能自动化会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 郭雨珍;蛋白质结构预测和比较的优化研究[D];大连理工大学;2007年
2 罗亮;蛋白质结构预测模型研究[D];华中科技大学;2010年
3 靳利霞;蛋白质结构预测方法研究[D];大连理工大学;2002年
4 吕志鹏;蛋白质结构预测的现实求解方法[D];华中科技大学;2007年
5 孙鹏飞;基于计算智能技术的蛋白质结构预测方法研究[D];哈尔滨工程大学;2010年
6 谷俊峰;蛋白质结构预测中几个关键问题的研究[D];大连理工大学;2009年
7 王明会;基于统计建模方法的蛋白质结构预测研究[D];中国科学技术大学;2006年
8 唐鹤云;基于多肽片段中央氨基酸装配的蛋白质结构预测[D];中国协和医科大学;2007年
9 刘景发;求解蛋白质结构预测问题及矩形packing问题的启发式算法[D];华中科技大学;2007年
10 何洁月;面向蛋白质结构预测的计算生物学技术研究[D];东南大学;2006年
中国硕士学位论文全文数据库 前10条
1 李延章;基于改进蜂群算法的三维蛋白质结构预测研究[D];大连大学;2015年
2 蔡菁;蛋白质结构预测的阈值接收算法研究[D];福建农林大学;2015年
3 李婀娜;蛋白质结构预测的噪声算法研究[D];福建农林大学;2016年
4 戴振鹏;蛋白质结构预测的混合智能优化算法及并行化[D];福建农林大学;2016年
5 罗升;基于深度学习的采样技术在蛋白质结构预测中运用[D];苏州大学;2016年
6 刘宏伟;无序蛋白质结构预测方法研究[D];苏州大学;2013年
7 秦传庆;蛋白质结构预测软件设计与开发[D];浙江工业大学;2014年
8 吴进珍;并行蚁群优化在蛋白质结构预测中的应用研究[D];苏州大学;2010年
9 岳晓辉;基于禁忌搜索算法的蛋白质结构预测的研究[D];大连理工大学;2006年
10 杜庆良;蛋白质结构预测的并行模拟退火算法研究[D];福建农林大学;2013年
本文关键词:基于深度学习的采样技术在蛋白质结构预测中运用,,由笔耕文化传播整理发布。
本文编号:478121
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/478121.html