当前位置:主页 > 理工论文 > 生物学论文 >

基于信息熵的蛋白质结构预测方法研究

发布时间:2021-08-23 13:51
  蛋白质是生物体内的大分子,是生命活动的主要承担者。遗传密码揭示了DNA转译为氨基酸序列的机制,而氨基酸序列如何折叠为蛋白质特定空间结构仍是未解之谜。蛋白质只有折叠为特定空间结构后才能发挥特定的生物学功能。因此,研究蛋白质空间结构对理解氨基酸序列和空间结构的关系具有重要理论价值,有助于人类理解蛋白质功能、设计药物和治疗疾病等。目前,测序技术高速发展,实验解析结构的技术发展相对缓慢。这一现状导致已知序列的数目与解析结构数目的差异呈指数增加。在理论价值和现实意义的双重驱动下,利用计算机,结合算法,以氨基酸序列为起点预测蛋白质三维结构是生物信息学领域的重要研究课题之一。从头预测方法是蛋白质结构预测领域的一类重要方法。该方法根据Anfinsen法则,在能量函数的指导下,利用优化算法进行构象空间采样,期望能够搜索并选择出近天然态构象。但是,蛋白质的构象空间巨大,能量景观极其粗糙,这使其成为蛋白质结构预测领域最具挑战性的任务之一。本文针对该问题,主要工作如下:(1)针对蛋白质结构预测问题,提出了基于接触图残基对距离约束的蛋白质结构预测算法。在该算法的探索阶段,通过残基对距离离散化,设计了基于残基对距... 

【文章来源】:浙江工业大学浙江省

【文章页数】:59 页

【学位级别】:硕士

【部分图文】:

基于信息熵的蛋白质结构预测方法研究


残基对评分Figure3-3.Scoreofaresidue-pair

散点图,散点图,能量函数,构象


兹曼标准接受的构象的评分和 RMSD。对于 T0869-D1,score_contact 与 RM关性明显高于能量函数与 RMSD 的相关性,从而使得算法能够更快搜索到态区域,得到精度更高的预测结果。对于 T0866-D1,score_contact 与 RM关性稍弱,但仍能够辅助能量函数区分构象的优劣。对于 T0859-D163-D1,能量函数和基于接触图的评分指标均与 RMSD 的相关性弱,导致预精度不够高。如表 3-4 所示,对 CDPSP-E、CDPSP-O 的 RMSD-average 值 CDPSP 进行成对 t 检验,得到 p-value。CDPSP-E 与 CDPSP 的 p-value 值065,小于 0.05,说明 CDPSP 显著优于 CDPSP-E;而 CDPSP-O 与 CDPSPa) T0859-D1 b) T0863-D1

实验测定,结构比


a) BR(RMSD=3.01 ) a) QK(RMSD=5.67 ) a) RX(RMSD=9.07 ) a) CDPSP(RMSD=5.15 )b) BR(RMSD=10.76 ) b) QK(RMSD=10.06 ) b) RX(RMSD=7.75 ) b) CDPSP(RMSD=5.65 )图3-5 预测结构与实验测定结构比对:a) T0868-D1 b) T0869-D1Figure 3-5. The structural comparisons between predicted models and experimentalstructures: a) T0868-D1 b) T0869-D1

【参考文献】:
期刊论文
[1]蛋白质结构预测[J]. 邓海游,贾亚,张阳.  物理学报. 2016(17)
[2]蛋白折叠预测[J]. 马彬广.  科学通报. 2016(24)
[3]蛋白质三级结构预测算法综述[J]. 王超,朱建伟,张海仓,巩海娥,郑伟谋,卜东波.  计算机学报. 2018(04)



本文编号:3357992

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/swxlw/3357992.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9cc10***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com