当前位置:主页 > 科技论文 > 自动化论文 >

基于距离谱的蛋白质结构预测方法研究

发布时间:2020-04-07 12:31
【摘要】:准确预测蛋白质的三维结构对蛋白质功能的注释、疾病研究、药物设计等方面有着重要的意义。然而,实验测定蛋白质三维结构的技术发展缓慢。因此,根据Anfinsen法则,利用计算机技术设计适当的算法,以氨基酸序列为起点,蛋白质三维结构为目标的从头预测方法已成为生物信息学中非常重要的研究课题。目前,蛋白质从头预测方法主要的技术瓶颈在于现有技术的构象空间采样能力不足和能量函数不精确。先验知识可以降低能量函数不精确带来的误差,并有效地减小构象的搜索空间,进而提高预测精度。但是如何将从大量的先验知识中提取有效的特征信息,并建立精确的打分模型来辅助蛋白质结构预测是问题的关键;此外,进化算法作为一种研究蛋白质构象空间优化的重要方法,引起了国内外研究者的关注,但是如何保持全局探索与局部增强的平衡,依旧是一个关键问题。本文基于距离谱,在进化算法的框架下,进行了以下的研究:(1)距离和疏水模型辅助的蛋白质结构预测方法。首先,根据氨基酸的亲疏水性构建氨基酸的回转半径来指导构象空间采样,有效地减小构象的搜索空间,进而提高了搜索效率;然后,利用距离谱构建距离分布估计模型,并结合疏水概率模型来指导种群更新,缓解能量函数不精确带来的误差。在基准数据集上进行测试,算法取得了良好的结果。(2)基于距离谱的两阶段蛋白质结构预测方法。首先,利用二分K-均值聚类算法从距离谱中提取特征信息,并用来构建特征相似度模型;其次,设计了基于相似度模型的选择策略来指导构象搜索,从而降低能量函数不精确带来的误差;最后,根据种群中相邻两代的进化信息设计了基于状态估计的两阶段采样策略,达到保持全局探索与局部增强的平衡,进而提高采样能力。在基准测试集上,通过分离实验以及与其他方法的比较,表明该算法是一种有效的蛋白质结构从头预测方法。
【图文】:

构建过程,残基,距离分布,折线图


浙江工业大学硕士学位论文离区间中的片段数目,绘制成折线图。若折线图在 0~9 内的某个距离区间内出峰值时,则记录下该距离分布,即为目标序列中第 p 和 q 个残基的距离谱。因短距离的相互作用比远距离的相互作用更加具有保守性,所以在距离谱中,只计 9pqd < 的片段对数。Zhang 和 Xu 提出目标蛋白的第 p 和第 q 个残基的 C子间的欧式距离有很大概率为pqd ,距离谱反应了残基对间的距离分布。pqpqd

DH模型,蛋白,精度


10 1gvp 8.34 8.58 10.42 12.49 12.93 12.74表 3-3 中 Lowest-RMSDc 代表预测得到的最低 RMSD 值,Mean-RMSDc得到的平均 RMSD 值。对于测试蛋白 1ail、1bkrA、1bgf 和 1gvp 来说,DH模型的 Lowest-RMSDc 都优于 Rosetta 和 QUARK,尤其是 1bkrA 和 1c8MA 算法的 Lowest-RMSDc 比 QUARK 和 Rosetta 的精度高 1 。虽然,DH法的 Lowest-RMSDc 结果比 QUARK 预测的差,但是 DHMA 预west-RMSDc优于Rosetta预测的结果,其中对于1hz6A、1ctf和1vcc蛋白,D的 Lowest-RMSDc 比 QUARK 的差,,但是在 Mean-RMSDc 方面,DHMA测精度优于 QUARK。1acf (DHMA) 1acf (Rosetta) 1acf (QUARK)
【学位授予单位】:浙江工业大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:Q51;TP18

【相似文献】

相关期刊论文 前10条

1 孟庆玲;黄家荣;;林木蛋白质结构预测研究综述[J];辽宁林业科技;2009年06期

2 王俊;邢丽丽;周鹏;;蛋白质结构预测方法研究[J];黑龙江科技信息;2008年19期

3 王化坤;钱伟懿;;神经网络方法在蛋白质结构预测中的研究与应用[J];黑龙江科技信息;2008年04期

4 张超;张晖;李冀新;高红;;基于遗传算法的蛋白质结构预测方法[J];生物信息学;2006年03期

5 牛卫东,潘宪明;蛋白质结构预测[J];世界科技研究与发展;1998年01期

6 张红娟;李斌;唐焕文;郭崇慧;;进化策略的一种改进及其在蛋白质结构预测中的应用[J];计算机与应用化学;2005年12期

7 张超;卢艳;李冀新;黄卫宁;陈正行;;遗传算法在蛋白质结构预测中的应用[J];生物技术通讯;2006年02期

8 林治华;蛋白质结构预测的方法学评述[J];免疫学杂志;2001年S1期

9 唐焕文,靳利霞,计明军;蛋白质结构预测的优化模型与方法[J];工程数学学报;2002年02期

10 陆恒云;杨根科;潘常春;;一种基于关联图的蛋白质结构预测改进算法[J];上海交通大学学报;2011年01期

相关会议论文 前6条

1 靳利霞;唐焕文;;基于能量极小化的蛋白质结构预测[A];中国运筹学会第六届学术交流会论文集(上卷)[C];2000年

2 张红娟;唐焕文;;蛋白质结构预测中的长短程作用分析与研究[A];大连理工大学生物医学工程学术论文集(第2卷)[C];2005年

3 王宝翰;齐力省;陈慰祖;王存新;;由结构预测走向折迭理论[A];第十次中国生物物理学术大会论文摘要集[C];2006年

4 方慧生;陈凯先;;一个有效解决远距离同源蛋白质结构预测及序列比对的有效方法[A];中国化学会第26届学术年会化学信息学与化学计量学分会场论文集[C];2008年

5 过涛;孙之荣;;膜蛋白跨膜区段序列分析和预测[A];第七届全国生物膜学术讨论会论文摘要汇编[C];1999年

6 吴爱平;田丽青;胡云;曹洋;苗智超;蒋太交;;蛋白质结构预测平台TJ_Jiang及其在CASP8中的表现[A];第十一次中国生物物理学术大会暨第九届全国会员代表大会摘要集[C];2009年

相关重要报纸文章 前2条

1 本报记者 赵广立;AlphaFold“大胜”人类的“戏码”不太足[N];中国科学报;2018年

2 ;蛋白质的折叠破译“第二遗传密码”(未完待续)[N];云南科技报;2001年

相关博士学位论文 前10条

1 汪心享;基于知识的蛋白质结构预测复合打分函数[D];华中科技大学;2019年

2 陈烨;基于群智能算法的蛋白质结构预测研究[D];中国矿业大学;2018年

3 张岩;基于群智能方法的蛋白质结构预测研究[D];上海交通大学;2016年

4 王明会;基于统计建模方法的蛋白质结构预测研究[D];中国科学技术大学;2006年

5 何洁月;面向蛋白质结构预测的计算生物学技术研究[D];东南大学;2006年

6 郭雨珍;蛋白质结构预测和比较的优化研究[D];大连理工大学;2007年

7 唐鹤云;基于多肽片段中央氨基酸装配的蛋白质结构预测[D];中国协和医科大学;2007年

8 高朋越;基于CALYPSO方法的XRD逆向结构搜索和蛋白质结构预测[D];吉林大学;2017年

9 刘景发;求解蛋白质结构预测问题及矩形packing问题的启发式算法[D];华中科技大学;2007年

10 张丽超;基于序列的蛋白质结构预测的机器学习模型[D];中国海洋大学;2015年

相关硕士学位论文 前10条

1 夏慧芳;基于范德华势能的蛋白质结构预测问题[D];南京航空航天大学;2019年

2 谢腾宇;基于信息熵的蛋白质结构预测方法研究[D];浙江工业大学;2019年

3 王小奇;基于距离谱的蛋白质结构预测方法研究[D];浙江工业大学;2019年

4 佟毓来;求解蛋白质二维结构预测问题的树搜索算法研究[D];华中科技大学;2019年

5 娄立峰;基于多信息融合的蛋白质结构预测研究[D];青岛科技大学;2018年

6 罗升;基于深度学习的采样技术在蛋白质结构预测中运用[D];苏州大学;2016年

7 陈卫峰;蛋白质结构预测及其方法研究[D];武汉大学;2005年

8 刘宏伟;无序蛋白质结构预测方法研究[D];苏州大学;2013年

9 吴进珍;并行蚁群优化在蛋白质结构预测中的应用研究[D];苏州大学;2010年

10 张红娟;基于非格点模型的蛋白质结构预测研究[D];大连理工大学;2006年



本文编号:2617917

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2617917.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户051be***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com