基于计算几何及序列保守性的蛋白质活性位点预测
本文选题:蛋白质三维结构 + 蛋白质活性位点 ; 参考:《上海交通大学》2011年硕士论文
【摘要】:在后基因组时代,生命科学的中心任务是阐明基因组所表达的真正执行生命活动的全部蛋白质的表达规律和生物功能。蛋白质与配体相互作用以及蛋白质结构与功能之间的关系是后基因组时代研究的核心内容,而蛋白质的结合位点的预测是这些研究领域的理论基础,同时也是基于结构的药物设计中至关重要的步骤,对计算机辅助药物设计和复合物结构预测具有重要意义,也是生物信息学领域一个重要的研究热点。 配体小分子通常结合于蛋白质表面类似口袋的区域,许多基于几何的算法都基于这一特性,在蛋白质表面寻找一些凹陷区域作为候选的蛋白质活性位点。本文中我们提出了了一种新颖的算法称为ConHull,首先通过三维凸包和蛋白质溶剂可及性表面相比较的方式计算出位于蛋白质口袋区域的原子,并通过K-means聚类方法将这些原子分成7个簇作为候选的活性位点。其次,将这些候选位点按照其体积进行排序,体积最大的前四者被保留,按照平均序列保守性分值进行进一步的排序。最后,在这些预测得的活性位点中,最保守的三个候选位点就是本文中得出的蛋白质活性位点。 为了验证ConHull算法的有效性,我们将它和其他三个不同类型的预测工具进行比较,分别是LIGSITEcs, PASS和SURFNET,并采用210个经典的非冗余的蛋白配体复合物作为测试数据集。在我们算法中,总预测成功率超过90%,并且高于其预测工具。从我们的算法可以知道,蛋白质活性位点预测不仅仅只是一个几何问题,每个口袋的空间大小,即体积在预测中确实是一个很重要的因素,但序列保守性分值的添加也可以增加预测的成功率。
[Abstract]:In the post-genome era, the central task of life science is to clarify the expression laws and biological functions of all proteins expressed by the genome that really carry out life activities. The interaction between protein and ligand and the relationship between protein structure and function are the core contents of the post-genomic era, and the prediction of protein binding sites is the theoretical basis of these research fields. It is also a crucial step in structure-based drug design, which is of great significance for computer-aided drug design and complex structure prediction, and is also an important research hotspot in the field of bioinformatics. Small ligand molecules are usually bound to pocket-like regions on protein surfaces. Many geometric-based algorithms are based on this property and seek hollow regions on protein surfaces as candidate protein active sites. In this paper, a novel algorithm called ConHull is proposed. Firstly, the atoms located in the protein pocket region are calculated by comparing the three-dimensional convex hull with the accessible surface of the protein solvent. These atoms were divided into 7 clusters as candidate active sites by K-means clustering method. Secondly, these candidate sites are sorted according to their volume, and the top four candidates with the largest volume are retained and further sorted according to the average conservative score of the sequence. Finally, among these predicted active sites, the three most conserved candidate sites are the protein active sites obtained in this paper. To verify the effectiveness of the ConHull algorithm, we compared it with three different types of prediction tools, namely LIGSITEcs, PASS and Surfnet, and used 210 classic non-redundant protein ligand complexes as test data sets. In our algorithm, the total prediction success rate is more than 90% and higher than its prediction tool. From our algorithm, we can see that the prediction of protein active sites is not just a geometric problem, but the size of each pocket space, that is, the volume, is a very important factor in the prediction. But the addition of conservative score can also increase the success rate of prediction.
【学位授予单位】:上海交通大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:R341
【相似文献】
相关期刊论文 前10条
1 宫美轩,张菱,刘典芳;保守性手术治疗输卵管妊娠62例临床分析[J];山东医药;2004年36期
2 郑文新;郑卫英;华琳;刘红;李林;;人类基因组isochore边界的保守性研究[J];中国优生与遗传杂志;2011年02期
3 杨苏安;保守性手术治疗输卵管妊娠27例报告[J];湖南医学;1994年06期
4 励春健;化疗后保守性手术治疗较大乳腺癌[J];国外医学.外科学分册;1996年03期
5 ;金黄色葡萄球菌高保守性fib基因的鉴定及其表达[J];国外医学.临床生物化学与检验学分册;1997年02期
6 郭晓强;;海帕西啶的保守性分析[J];白求恩军医学院学报;2007年01期
7 戴静珠;李霞;;直系同源蛋白在蛋白质互作网络中的特性及其受到microRNA调控的特点研究[J];中国优生与遗传杂志;2009年03期
8 龚艺;崔亚利;牛司强;张雪梅;胥文春;何於娟;王虹;;肺炎链球菌假想蛋白SPD0414的表达纯化及保守性分析[J];中国免疫学杂志;2010年09期
9 张文禄,李勤,刘积芳,李明众,吴向陇,张哲舫,孙文洁;乳腺癌的保守性手术加放疗——23例治疗小结[J];中华放射肿瘤学杂志;1990年03期
10 刘荫华,王文治,黄莛庭;保守性乳腺癌切除术治疗现状[J];中华普通外科杂志;1996年02期
相关会议论文 前10条
1 黄象艳;克丙申;李保昌;徐军;杨道理;胡成进;;中国人HLA—DPB1序列保守性分析及基因定型研究[A];中国免疫学会第四届学术大会会议议程及论文摘要集[C];2002年
2 应申;李霖;;计算几何在地图综合中的应用[A];中国地理信息系统协会第八届年会论文集[C];2004年
3 胡珊;李力;郑英如;郭建新;;保守性手术治疗输卵管妊娠临床研究[A];第八次全国妇产科学学术会议论文汇编[C];2004年
4 常珊;李春华;龚新奇;陈慰祖;王存新;;蛋白质不同区域的氨基酸保守性网络分析[A];第十次中国生物物理学术大会论文摘要集[C];2006年
5 张显全;刘丽娜;唐振军;;一种凸多边形直径算法[A];广西计算机学会2005年学术年会论文集[C];2005年
6 艾星子·艾里;张静;热娜;季菲;丁岩;;腹腔镜保守性术后联合曲普瑞林的不同治疗方案治疗子宫内膜异位症的临床疗效[A];中华医学会第三次全国绝经学术会议暨绝经相关问题学习班论文汇编[C];2011年
7 徐旭岭;丁旭东;隋永枫;张军辉;;汽轮机叶型的数字化及几何信息采集[A];2009年中国动力工程学会透平专业委员会2009年学术研讨会论文集[C];2009年
8 郭明武;;计算几何理论及其在GIS中的应用现状与前景[A];湖北省测绘学会2006年度科学技术交流会论文集[C];2006年
9 白逢彦;王启明;陆惠中;吴作为;贾建华;;酵母菌种内和种间rDNA序列保守性和变异性分析[A];中国第六届海峡两岸菌物学学术研讨会论文集[C];2004年
10 吴爱国;段广仁;;不确定离散线性系统鲁棒ESPR估计新方法[A];第16届中国过程控制学术年会暨第4届全国故障诊断与安全性学术会议论文集[C];2005年
相关重要报纸文章 前10条
1 中国人民大学佛教与宗教学理论研究所副教授 美国普度大学博士后 魏德东;论中国当代宗教的保守性与开放性[N];中国民族报;2008年
2 蔡小伟邋余荣华;福建治疗禽流感科研获国际性重大突破[N];人民日报;2007年
3 高新城;以思想大解放推动城建发展[N];石家庄日报;2008年
4 阮莉珠 整理;一代大师影响几代人[N];上海科技报;2009年
5 满村;过度兴奋同样有害[N];北京科技报;2003年
6 苏宁;八仙过海 各显神通[N];中国矿业报;2006年
7 ;杰出数学家——苏步青[N];光明日报;2006年
8 杨斌鹄 尚云;陕西商邦一段逝去的辉煌(下)[N];经理日报;2006年
9 ;杰出数学家 苏步青[N];人民日报;2006年
10 本报记者 张文杰;一个西安总裁的反击之策[N];中国经营报;2008年
相关博士学位论文 前10条
1 杨传勇;欧氏障碍空间的最短路径问题解法(MA-ESPO)[D];武汉大学;2005年
2 董小燕;严复政治思想研究[D];浙江大学;2006年
3 曲吉林;时间序列挖掘中索引与查询技术的研究[D];天津大学;2006年
4 徐维江;网络计算中的私有数据保护问题及其应用研究[D];中国科学技术大学;2008年
5 荆巍巍;安全多方计算中若干基础协议及应用的研究[D];中国科学技术大学;2008年
6 焦立男;地面移动机器人运动规划与运动协调的若干算法研究[D];南京理工大学;2008年
7 辛士庆;从离散测地问题到动态有序集[D];浙江大学;2009年
8 王合义;特定人群健康状况系统模型及分析[D];天津大学;2008年
9 李海军;计算机图形学若干基本算法的实现研究[D];吉林大学;2008年
10 戴光明;避障路径规划的算法研究[D];华中科技大学;2004年
相关硕士学位论文 前10条
1 何静;基于计算几何及序列保守性的蛋白质活性位点预测[D];上海交通大学;2011年
2 马立玲;分区加权Voronoi图的生成及其面积计算[D];河北师范大学;2004年
3 孙彦飞;安全多方计算中若干计算几何协议的研究[D];安徽大学;2010年
4 祝春华;论牛津大学的保守性[D];吉林大学;2007年
5 汤立东;计算几何中LR可视化问题研究[D];大连海事大学;2010年
6 刘杉;基于计算几何流分类算法的研究[D];合肥工业大学;2010年
7 刘倩;基于转录终点信号或保守性的大肠杆菌sRNA预测研究[D];中国人民解放军军事医学科学院;2011年
8 王毅;基于数字化图像的民族艺术平面构成系统的构成规则的研究[D];昆明理工大学;2005年
9 凌程明;论保守主义思想影响下的美国劳工运动的保守性问题(至二战前)[D];山东师范大学;2009年
10 郭轶男;上皮性卵巢癌患者保留生育功能13例分析[D];浙江大学;2009年
,本文编号:1928462
本文链接:https://www.wllwen.com/xiyixuelunwen/1928462.html