以位置特异性得分矩阵和基因本体为特征的蛋白质亚细胞定位预测
本文关键词: 定位预测 蛋白质亚细胞 位置特异性得分矩阵 基因本体 多标签分类 出处:《福州大学学报(自然科学版)》2017年01期 论文类型:期刊论文
【摘要】:提出一种蛋白质亚细胞定位预测方法.该方法以位置特异性得分矩阵和基因本体抽取对应特征,结合支持向量机构建多标签分类模型.充分考虑了蛋白质进化信息对其亚细胞定位的影响,并基于文本分类中涉及到的卡方检验的对数变换思想,构建基因本体注释信息的加权系数对其进行加权处理,从而提高预测的准确率.采用支持向量机作为基分类器构建多标签分类模型,进一步提高预测的准确率.通过在目前该领域两个常用的真实数据集上进行的一系列测试结果表明,该方法能有效提高蛋白质亚细胞定位预测的准确率.
[Abstract]:A protein subcellular localization prediction method is proposed, in which the location specificity score matrix and the gene body are used to extract the corresponding features. A multi-label classification model based on support vector mechanism is built. The influence of protein evolution information on subcellular localization is fully considered, and based on the logarithmic transformation idea of chi-square test involved in text classification. The weighted coefficients of the annotation information of gene ontology are constructed to improve the accuracy of prediction. Support vector machine (SVM) is used as the base classifier to construct the multi-label classification model. A series of test results on two common real data sets in this field show that this method can effectively improve the accuracy of protein subcellular localization prediction.
【作者单位】: 福州大学数学与计算机科学学院;
【基金】:福建省自然科学基金资助项目(2012J05114) 福建省产学研重大专项基金资助项目(2012G106)
【分类号】:Q51
【相似文献】
相关期刊论文 前5条
1 崔舒宁;朱丹军;冯博琴;昂正全;;结合受控词汇表的生物基因本体标注与分类[J];西安交通大学学报;2008年02期
2 唐晋韬;王挺;王戟;;利用复杂网络分析方法研究基因本体隐藏结构信息(英文)[J];Journal of Southeast University(English Edition);2010年01期
3 朱文楠;习杨;吕湘;刘德培;;人类miRNA上游转录因子及下游靶基因的基因本体分析[J];中国微生态学杂志;2011年08期
4 唐秋菊;须涛;王东;李令锦;杜林方;;聚类GO术语在基因表达差异研究中的应用[J];应用与环境生物学报;2011年03期
5 ;[J];;年期
相关博士学位论文 前3条
1 彭佳杰;基因本体术语相似度计算和扩展方法研究[D];哈尔滨工业大学;2015年
2 许庆炜;基因本体及其注释数据语义网模型[D];华中科技大学;2008年
3 梅素玉;基于机器学习的蛋白亚细胞定位预测[D];复旦大学;2010年
相关硕士学位论文 前4条
1 杨开欣;基于领域本体的生物医学文献挖掘算法研究及其系统实现[D];北京交通大学;2016年
2 高美春;一种基于基因本体的无监督聚类方法[D];福建农林大学;2011年
3 胡运翠;基于语义资源的基因命名标准化和功能预测研究[D];大连理工大学;2011年
4 毕然;基于序列特征的蛋白质分子功能预测[D];华中科技大学;2006年
,本文编号:1523367
本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/1523367.html