基于多特征信息及Ma-Ada多分类器融合的蛋白质结构类预测
发布时间:2017-09-13 19:00
本文关键词:基于多特征信息及Ma-Ada多分类器融合的蛋白质结构类预测
更多相关文章: 蛋白质结构类预测 特征信息集 Ma-Ada多分类器融合
【摘要】:蛋白质序列特征表示和机器学习算法是影响蛋白质结构类预测效果好坏的两个重要方面。本研究基于k-字统计频率和k-片段位置分布两种特征提取方法,将分别提取到的氨基酸序列信息和物理化学性质信息同蛋白质二级结构信息进行融合,建立17维和57维的特征信息集,并尝试在Adaboost.M1算法中引入Multi-Agent多智能体融合的思想,提出了一种Ma-Ada多分类器融合算法。该算法作为蛋白质结构类的预测工具,充分挖掘了单分类器度量层信息以及各个单分类器之间的交互融合信息。实验结果表明,Ma-Ada算法在Z277、Z498、1189和D640四个蛋白质数据集的57维特征信息集上的分类率分别达到了91.3%、96.8%、85.3%和87.2%,在17维特征信息集上的分类率也分别达到了90.6%、95.8%、84.8%和88.3%。与其它蛋白质结构类预测方法的结果相比,本方法能够获得较好的分类率。
【作者单位】: 杭州电子科技大学生命信息与仪器工程学院;
【关键词】: 蛋白质结构类预测 特征信息集 Ma-Ada多分类器融合
【基金】:国家自然科学基金(61271063) 国家重点基础研究发展计划(973计划)(2013CB329502) 国家杰出青年科学基金(60788101)
【分类号】:R341
【正文快照】: 引言人类基因组计划的顺利实施带来了蛋白质数据库中海量的序列信息,面对浩瀚的蛋白质序列数据,传统通过实验方法测定蛋白质结构已经远远不能满足人类的需求。因此,探讨通过理论计算方法来预测蛋白质结构类别显得尤为重要。蛋白质功能的确定有助于阐明生命体在生理或病理条件
【参考文献】
中国期刊全文数据库 前5条
1 彭芳青;厉力华;徐伟栋;刘伟;张娟;邵国良;;基于Multi-Agent的乳腺钼靶图像肿块分类方法[J];传感技术学报;2010年02期
2 武勃,黄畅,艾海舟,劳世z,
本文编号:845319
本文链接:https://www.wllwen.com/yixuelunwen/jichuyixue/845319.html