基于序列信息的两种赖氨酸翻译后修饰位点的预测算法开发

发布时间:2018-12-19 16:37
【摘要】:无论是在真核还是原核细胞中,赖氨酸是蛋白序列中最常见的翻译后修饰位点。为了进一步探究赖氨酸修饰的分子机制,需要准确地识别出序列中赖氨酸修饰的位点和修饰的程度。到目前为止,识别赖氨酸修饰位点的实验方法有很多,但这些实验方法通常花费昂贵且耗时耗力。因此,基于蛋白质序列信息预测赖氨酸翻译后修饰位点的计算方法受到越来越多的青睐。在本文中,作者重点研究了两种赖氨酸翻译后修饰的类型(pupylation和琥珀酰化)。Pupylation在细菌中作为一种有利于细胞行使功能的翻译后修饰类型,通常调节原核细胞中的蛋白质功能。在pupylation过程中,原核生物类泛素化标记作用在功能上与泛素化相似,可以标记靶蛋白来促进蛋白酶体的降解。本文中,作者通过系统地分析开发了一个名为pbPUP的pupylation位点预测器。特别是作者采用了一套复杂的编码方案,即基于氨基酸对的组成的编码pbCKSAAP,用来表征pupylation位点周围序列片段的序列模式和进化信息,并应用支持向量机构建其预测模型。10折交叉检验结果显示,在pbPUP性能表现中AUC值为0.849,并且在独立测试集中的表现远远好于现有的其他预测器。网络服务器pbPUP和后台数据免费提供服务,网址为:http://protein.cau.edu.cn/pbPUP/。作为一种新发现的蛋白质翻译后修饰,赖氨酸的琥珀酰化在原核和真核生物中对于调节细胞过程中蛋白质功能同样起着重要的作用。本文中作者通过整合三种编码方法开发了一个名为SuccinSite的计算工具来对蛋白质琥珀酰化位点进行预测,三种编码分别为基于k空格氨基酸对组成的编码,二进制编码和基于氨基酸理化性质的编码。5折交叉检验结果显示,在SuccinSite性能表现中AUC值为0.802,同样在独立测试集中的预测表现也好于其他现有预测器。此外,作者从随机森林中训练出的模型中还提取到了位点周围的信息特征和比较重要的特征组合规律,从侧面解释了预测器的工作原理。最后,作者整理了一个数据库,其中包括4,411个经过试验验证的琥珀酰化蛋白质中的12,456个琥珀酰化位点。网络服务器,训练及测试数据集,源代码和数据库均可以免费供大家查看和使用,网址为:http://systbio.cau.edu.cn/SuccinSite/。综上所述,本文中作者所开发的预测器(pbPUP和SuccinSite)将对赖氨酸的pupylation和琥珀酰化位点的预测具有较大的帮助。
[Abstract]:Lysine is the most common post-translational modification site in protein sequences, both in eukaryotic and prokaryotic cells. In order to further explore the molecular mechanism of lysine modification, it is necessary to accurately identify the sites and degree of lysine modification in the sequence. Up to now, there are many methods to identify lysine modified sites, but these methods are usually expensive and time-consuming. Therefore, prediction of lysine posttranslational modification sites based on protein sequence information has attracted more and more attention. In this paper, two types of lysine posttranslational modification (pupylation and succinylated). Pupylation) have been studied in bacteria as a kind of posttranslational modification that is beneficial to the function of cells, which usually regulates the protein function in prokaryotic cells. In the process of pupylation, prokaryotic ubiquitin labeling is functionally similar to that of ubiquitin, and can be labeled as target proteins to promote proteasome degradation. In this paper, a pupylation locus predictor called pbPUP is developed by systematic analysis. In particular, the authors used a complex coding scheme, namely, a coding pbCKSAAP, based on the composition of amino acid pairs to characterize the sequence patterns and evolutionary information of sequences around pupylation loci. The 10 fold cross test results show that the AUC value of the pbPUP performance is 0.849, and the performance of the independent test set is much better than that of other existing predictors. Web server pbPUP and background data are available free of charge at http://protein.cau.edu.cn/pbPUP/. As a newly discovered protein posttranslational modification, lysine succinylation also plays an important role in prokaryotic and eukaryote regulation of protein function. In this paper, the authors developed a computational tool called SuccinSite to predict succinylation sites by integrating three coding methods. The three codes are composed of k-space amino acid pairs. Binary coding and encoding based on the physicochemical properties of amino acids. 50% discount cross test results show that the AUC value of SuccinSite performance is 0.802, and the prediction performance in independent test set is better than that in other existing predictors. In addition, the authors also extracted the information features around the site and the more important feature combination rules from the model trained in the random forest, and explained the working principle of the predictor from the side. Finally, the authors collated a database containing 12456 succinylation sites of 4411 tested succinylated proteins. Web servers, training and testing datasets, source code and databases are free to view and use at http://systbio.cau.edu.cn/SuccinSite/. In conclusion, the predictors (pbPUP and SuccinSite) developed in this paper will be helpful to predict the pupylation and succinylation sites of lysine.
【学位授予单位】:中国农业大学
【学位级别】:博士
【学位授予年份】:2016
【分类号】:Q811.4

【相似文献】

相关期刊论文 前10条

1 李虹;谢鹭;;预测和鉴定蛋白质翻译后修饰的生物信息方法[J];现代生物医学进展;2008年09期

2 郭会灿;;蛋白质翻译后修饰研究进展[J];生物技术通报;2011年07期

3 甄艳;施季森;;组蛋白翻译后修饰技术研究进展[J];生物学杂志;2012年02期

4 郑学学;朱力;廖祥儒;王恒j;;细菌中常见的蛋白翻译后修饰[J];生物技术通讯;2009年04期

5 史立伟;张莉萍;;O亚型叉头框蛋白质翻译后修饰研究进展[J];生命的化学;2009年06期

6 陈英;张锴;何锡文;张玉奎;;质谱技术鉴定细胞中组蛋白翻译后修饰的研究进展[J];化学进展;2010年04期

7 罗樨,刘秋云;昼夜生物钟、负反馈调节与翻译后修饰[J];生命的化学;2000年04期

8 张玲;袁多多;戚正武;;芋螺毒素的翻译后修饰[J];生命科学研究;2009年03期

9 李振亚;顾宏博;;翻译后修饰蛋白质组学研究的新技术策略[J];生命的化学;2014年02期

10 阮班军;代鹏;王伟;孙建斌;张文涛;颜真;杨静华;;蛋白质翻译后修饰研究进展[J];中国细胞生物学学报;2014年07期

相关会议论文 前4条

1 陈永湘;;具有翻译后修饰蛋白质的合成[A];中国化学会第29届学术年会摘要集——第22分会:化学生物学[C];2014年

2 聂舟;徐霞红;周江;韩逸陶;姚守拙;;基于免抗体识别的翻译后修饰酶功能分析[A];中国化学会第29届学术年会摘要集——第04分会:纳米生物传感新方法[C];2014年

3 李艳梅;罗施中;黄志平;陈永湘;赵玉芬;;利用MALDI-TOF鉴定蛋白质翻译后修饰位点的研究[A];中国蛋白质组学第二届学术大会论文摘要论文集[C];2004年

4 张乾勇;易龙;糜漫天;;ω-3多不饱和脂肪酸对肿瘤细胞Rho蛋白翻译后修饰的影响[A];中国营养学会第十次全国营养学术会议暨第七届会员代表大会论文摘要汇编[C];2008年

相关博士学位论文 前10条

1 王平;翻译后修饰及显性负突变对PKM2结构与功能调控的分子机制研究[D];复旦大学;2014年

2 成尚利;氧化还原类蛋白质翻译后修饰的结构生物信息学研究[D];上海交通大学;2014年

3 Md.Mehedi Hasan;基于序列信息的两种赖氨酸翻译后修饰位点的预测算法开发[D];中国农业大学;2016年

4 党永军;微管相关蛋白1轻链蛋白3家族翻译后修饰方式的研究[D];复旦大学;2003年

5 薛宇;蛋白质翻译后修饰和细胞信号通路的生物信息学[D];中国科学技术大学;2006年

6 李晶;综合蛋白质翻译后修饰数据库的构建和分析[D];华中科技大学;2014年

7 王天元;利用基因编码的非天然氨基酸研究甲酸化及甲酰化赖氨酸翻译后修饰[D];中国科学技术大学;2015年

8 姚琪;蛋白质翻译后修饰及不同修饰间相互调控研究[D];武汉大学;2011年

9 刘栋;质谱技术对蛋白质翻译后修饰的检测在临床及基础研究中的应用[D];第四军医大学;2013年

10 曹戟;活性氧簇(ROS)介导的蛋白翻译后修饰调控肿瘤细胞死亡的作用及其机制研究[D];浙江大学;2013年

相关硕士学位论文 前9条

1 秦伟伟;加热洗脱硝酸纤维膜上保存的尿蛋白质及尿蛋白质翻译后修饰的研究[D];北京协和医学院;2015年

2 尹剑锐;从多肽水平结合多种翻译后修饰信息研究差异蛋白质组学[D];北京协和医学院;2014年

3 刘浏;正常人尿蛋白质组翻译后修饰的鉴定[D];北京协和医学院;2013年

4 陈祥;蛋白质翻译后修饰位点识别研究和应用[D];南昌大学;2014年

5 刘涛;组蛋白翻译后修饰的定量分析及在白血病细胞耐药机制研究中的应用[D];第二军医大学;2014年

6 谢靖宇;一种基于串联质谱鉴定蛋白质突变和翻译后修饰的算法[D];湘潭大学;2006年

7 汪邦山;酪氨酸修饰原位相互影响的生物信息学分析[D];中国科学技术大学;2013年

8 祝叶萍;乙酰化蛋白的鉴定研究[D];复旦大学;2008年

9 索生宝;蛋白质翻译后修饰位点预测及其功能分析[D];南昌大学;2013年



本文编号:2387178

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/jckxbs/2387178.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户bb726***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com