【摘要】:蛋白质二级结构是指蛋白质骨架结构中有规律重复的构象。由蛋白质原子坐标正确地指定蛋白质二级结构是分析蛋白质结构与功能的基础,二级结构的指定对于蛋白质分类、蛋白质功能模体的发现以及理解蛋白质折叠机制有着重要的作用。并且蛋白质二级结构信息广泛应用到蛋白质分子可视化、蛋白质比对以及蛋白质结构预测中。而目前蛋白质二级结构指定方法的一致性较差,因此,蛋白质二级结构指定仍然是结构生物信息学中一个比较活跃的课题。目前有超过20种蛋白质二级结构指定方法,这些方法大体可以分为两大类:基于氢键和基于几何,不同方法指定结果之间的差异较大。对于蛋白质中最重要的二级结构之一的螺旋而言,这种差异可能是来源于已有的方法指定螺旋时并没有严格地遵循螺旋的几何特征:它们或者使用不能准确计算的氢键能量,或者使用没有准确范围的残基骨架二面角,或者使用的几何特征(如Cα原子之间距离与夹角)不足以定义一条完整的螺旋曲线。DSSP(Define Secondary Structure of Proteins)是蛋白质二级结构指定领域比较公认的标准,DSSP是基于氢键的指定方法,它利用静电能量代替氢键能量并且通过近似计算得到氢原子坐标。蛋白质内部疏水环境的介电常数和蛋白质表面的介电常数差异很大,DSSP并没有考虑残基所处的环境而将介电常数作为一个定值,另外由于氢键模式会有交叉重叠(与多个残基形成氢键),因此DSSP会指定出一些在几何上明显异常与不规则的二级结构。STRIDE(STRuctural IDEntification)可以看做是DSSP的改进,STRIDE统计了螺旋和片层残基骨架二面角在拉氏图上的分布,在指定时将具有异常骨架二面角的残基排除,即使这些残基形成了螺旋与-片层相应的氢键模式。但是,STRIDE关注每个残基局部的几何特征,并没有考虑如何使二级结构整体片段更加一致。在研究蛋白质二级结构指定时,我们发现,有一些二级结构出现在蛋白质配体结合位点概率很高,并且与蛋白质的功能关系密切,进一步研究发现,拉氏图上不同区域的残基对蛋白质配体结合位点倾向性不同。蛋白质配体结合位点预测是生物信息领域热门课题之一,但是,尚没有研究将蛋白质残基骨架二面角对配体结合位点的倾向性利用到配体结合位点预测上来。本文的主要研究内容如下:1.提出了新的蛋白质螺旋指定算法HELIX-F。我们将螺旋指定问题分为两个子问题:最小化问题与约束满足问题。HELIX-F通过拟合算法搜索一系列空间螺旋曲线以最佳地拟合到蛋白质连续四个残基的Cα原子上,这部分解决的是第一个最小化问题。利用最佳拟合的螺旋曲线我们可以得到相应的螺旋参数,这些螺旋参数被我们用于蛋白质中螺旋的指定。结果显示,HELIX-F可以准确地指定310-螺旋,-螺旋,-螺旋,并且可以指定左手螺旋和PPII螺旋(这两类螺旋在蛋白质功能上具有重要作用,而DSSP和STRIDE不能指定)。在8个基于几何的螺旋指定程序中,HELIX-F与DSSP符合率最高,且相比较于DSSP,HELIX-F指定的螺旋在结构上更加一致。HELIX-F可以准确地指定螺旋的精细结构,这有助于蛋白质分类和蛋白质结构-功能的研究。2.分析残基的螺旋打分(以及螺旋参数)和蛋白质结构功能的关系。我们分析HELIX-F计算的残基螺旋打分(螺旋参数)和该螺旋残基在蛋白质中结构与功能的关系。结果发现,HELIX-F指定的-螺旋和蛋白质配体结合位点有着紧密的联系;螺旋残基的打分越高,残基越倾向于暴露在溶剂中,并且越难与蛋白质中其他残基形成氢键。HELIX-F拟合的最佳空间螺旋曲线被我们用于大分子中螺旋的可视化(包括蛋白质的螺旋结构和DNA的双螺旋结构),大分子中螺旋的扭曲形变处往往和蛋白质、DNA功能关系密切;我们分析了DNA在不同区域的几何变化:蛋白质DNA相互作用处DNA的双螺旋结构会发生较大的扭曲。HELIX-F计算的螺旋参数还可以用于分析蛋白质螺旋残基在折叠过程中结构的动态变化。另外,本文对HELIX-F指定的左手螺旋和PPII螺旋(这两种螺旋在蛋白质中较为稀少但是在功能上很重要且研究较少)做了一些分析。3.提出蛋白质二级结构指定算法SACF。SACF的核心思想是找到DSSP指定二级结构片段中的离群Cα片段并将其排除,对剩余片段进行几何聚类,聚类后每个簇的中心Cα片段作为模板,新的指定只需要和模板Cα片段进行比较即可。SACF与STRIDE相同之处在于都是通过几何特征排除离群的构象,但是我们将二级结构片段看做一个整体结构而不是像STRIDE那样关注残基局部几何特征:?/,这么做的好处是使得SACF指定结果在整体Cα片段上更加一致。虽然二级结构指定程序很多,但是目前没有研究对这些程序指定结果做过系统地比较,我们对其中11个程序对2,817个蛋白质的指定结果进行比较发现PCASSO与DSSP符合率最高,紧接着是SACF、KAKSI、PROSS这三个程序。我们分析了不同指定方法差异最大的区域:二级结构的N端和C端处,发现如果以DSSP作为标准的话,SACF、PCASSO倾向于缩短二级结构的N端与C端,而P-SEA、KAKSI、SEGNO更倾向于延伸两端。SACF指定二级结构的一致性有助于蛋白质分类和预测,另外,我们发现,SACF找到离群Cα原子片段和蛋白质的功能联系密切。4.发现拉氏图上若干区域残基倾向于出现在配体结合位点,分析这些区域残基的物理化学性质以及氨基酸组成和倾向性的差异,并利用MF-PLB预测蛋白质配体结合位点。II通过一些二级结构经常出现在功能位点我们发现在拉氏图上存在9个区域残基倾向于出现在配体结合位点,这些区域残基的前一位残基会更多的暴露在溶剂中,并且其后一位残基会与配体形成更多的氢键与范德华相互作用。另外,我们发现,氨基酸残基对配体结合位点的倾向性与残基暴露在溶剂中的程度有关,因此,我们在配体结合倾向指数(PLB)基础上结合残基骨架二面角与溶剂可及面积这两个因素发展了多因素配体结合倾向指数(MF-PLB)。通过对两个测试集中蛋白质的配体结合位点进行预测我们发现MF-PLB可以提高Ligsite-cs的预测准确率,并且,MF-PLB预测的成功率优于Ligsite-csc和PLB。另外,空腔周围残基的平均MF-PLB对于研究蛋白质配体结合位点也具有一定的意义。
[Abstract]:......
【学位授予单位】:吉林大学
【学位级别】:博士
【学位授予年份】:2016
【分类号】:Q51
【相似文献】
相关期刊论文 前10条
1 孟翔燕;孟军;葛家麒;;蛋白质二级结构预测方法的评价[J];生物信息学;2010年03期
2 王菲露;宋杨;;基于广义回归神经网络的蛋白质二级结构预测[J];计算机仿真;2012年02期
3 陈念贻,缪强;模式识别方法研究蛋白质二级结构的规律[J];科学通报;1986年09期
4 李晓琴,罗辽复;蛋白质结构类预测的新方法──基于蛋白质二级结构序列的预测方法[J];内蒙古大学学报(自然科学版);1998年05期
5 王波,吴晓明,宋长新,程敬之;基于网络服务的蛋白质二级结构预测软件[J];西安交通大学学报;2002年10期
6 张海霞,唐焕文,张立震,靳利霞,唐一源;蛋白质二级结构预测方法的评价[J];计算机与应用化学;2003年06期
7 李晓琴,罗辽复,刘次全;翻译速率与蛋白质二级结构的关系[J];生物化学与生物物理学报;2003年02期
8 朱伟,史定华,王翼飞;神经网络在蛋白质二级结构预测中的应用[J];自然杂志;2003年03期
9 闫化军;傅彦;章毅;李毅超;;神经网络方法预测蛋白质二级结构[J];计算机科学;2003年11期
10 孙向东,韦柳静,黄日波;蛋白质二级结构预测的支持向量机模型研究[J];广西农业生物科学;2004年01期
相关会议论文 前10条
1 王守源;李晓琴;罗辽复;;氨基酸分类与蛋白质二级结构相关性[A];第九次全国生物物理大会学术会议论文摘要集[C];2002年
2 孙海军;阮晓钢;;氨基酸序列编码对蛋白质二级结构预测的影响[A];第二十二届中国控制会议论文集(下)[C];2003年
3 陈明杰;王焕峰;刘伟;;基于基团编码的蛋白质二级结构预测[A];中国化学会第26届学术年会化学信息学与化学计量学分会场论文集[C];2008年
4 宋亮;张剑;王先明;温继敏;陈海波;姚端正;蒋昌忠;;人工神经网络预测蛋白质结构的探讨[A];湖北省物理学会、武汉物理学会成立70周年庆典暨2002年学术年会论文集[C];2002年
5 杨惠云;田心;;神经网络预测蛋白质二级结构的研究[A];天津市生物医学工程学会2007年学术年会论文摘要集[C];2007年
6 罗三华;黄建华;邱建丁;;小波支持向量机在蛋白质二级结构分类预测中应用[A];中国化学会第26届学术年会化学信息学与化学计量学分会场论文集[C];2008年
7 丛培盛;王志恒;王思聪;李通化;;基于SPSSM的蛋白质二级结构预测进展[A];中国化学会第29届学术年会摘要集——第19分会:化学信息学与化学计量学[C];2014年
8 孙向东;黄日波;;运用SVMs原理预测蛋白质二级结构研究[A];广西微生物学会2003年学术年会论文集[C];2003年
9 王靖;郭晨;梁向峰;郑丽丽;陈澍;马俊鹤;刘会洲;;阳离子表面活性剂CTAB对蛋白质二级结构的影响[A];第十四届全国分子光谱学术会议论文集[C];2006年
10 孙衍华;刘继凤;迟学斌;;GridMol:基于网格的分子可视化建模软件[A];第九届全国计算(机)化学学术会议论文摘要集[C];2007年
相关博士学位论文 前10条
1 曹晨;蛋白质二级结构指定和功能分析[D];吉林大学;2016年
2 王勇献;蛋白质二级结构预测的模型与方法研究[D];国防科学技术大学;2004年
3 石鸥燕;蛋白质结构预测模型的研究[D];天津医科大学;2008年
4 张胜利;蛋白质与RNA中的若干问题研究[D];大连理工大学;2011年
5 刘君;融合计算智能的蛋白质结构预测研究[D];重庆大学;2011年
6 贾孟文;mRNA序列、结构、能量和蛋白质二级结构的相关性[D];内蒙古大学;2004年
7 赵裕众;生物序列分析算法的研究及其应用[D];中国科学技术大学;2010年
8 李明辉;基于机器学习的蛋白质二级结构和相互作用预测[D];哈尔滨工业大学;2007年
9 王艳春;基于GEP和ANN的蛋白质二级结构预测方法研究[D];西北农林科技大学;2009年
10 严文颖;氨基酸相互作用网络的构建、分析及应用[D];苏州大学;2013年
相关硕士学位论文 前10条
1 石林凡;拉面面团微观结构研究及品质改良[D];河南工业大学;2015年
2 赵丹丹;拉面面团性质研究及制面工艺优化[D];河南工业大学;2015年
3 王洪亮;基于遗传算法的蛋白质二级结构预测研究[D];哈尔滨工程大学;2008年
4 梅启鹏;蛋白质二级结构中的简化编码技术[D];华中科技大学;2004年
5 梁刚锋;蛋白质二级结构的建模与预测[D];国防科学技术大学;2005年
6 于淑惠;基于神经网络的蛋白质二级结构预测建模研究[D];西南大学;2006年
7 孙海军;基于神经网络的蛋白质二级结构预测问题的研究[D];北京工业大学;2004年
8 张海霞;蛋白质二级结构预测方法研究[D];大连理工大学;2004年
9 景楠;基于神经网络方法蛋白质二级结构预测的研究[D];吉林大学;2004年
10 闫蓬勃;蛋白质二级结构预测准确率影响因素探讨[D];河北大学;2009年
,
本文编号:
2352668