当前位置:主页 > 医学论文 > 实验医学论文 >

基于支持向量机的蛋白质分类研究

发布时间:2020-08-31 12:40
   随着人类基因组计划的顺利进展,越来越多的蛋白质序列被测定出来;而通过实验确定其结构与功能的蛋白质序列则相对较少,且两者之间的差距有迅速扩大的趋势。由于通过实验确定蛋白质的结构和功能费时、费力、费财,且实验中可能还会遇到一些目前无法解决的困难,因此探索利用理论及计算方法来研究蛋白质结构和功能具有重要意义。本文从蛋白质的一级序列出发,研究了蛋白质的结构、功能分类预测,其主要贡献如下: 1.提出一种新的组合分类思想,即将氨基酸组成成分、自相关函数二种特征提取法与支持向量机恰当组合,首次对蛋白质同源二聚体和非同源二聚体进行分类研究,并与国际上现有的Garian方法进行了对比。在10CV检验下,本文方法的分类总精度比Garian方法最大可提高17.1个百分点。 2.提出二种新的特征提取法,并引入以前已有的二种特征提取法,与支持向量机和不同的分类策略,进行恰当的组合构成分类系统,首次对蛋白质同源二聚体、同源三聚体、同源四聚体和同源六聚体进行分类研究。结果表明整合了氨基酸残基序列顺序信息的三种特征提取法,其分类能力均好于氨基酸组成成分特征提取法,尤以我们提出的加权自相关函数特征提取法的分类效果最好,其分类总精度可比氨基酸组成成分特征提取法最大可提高6.39个百分点,比Chou的特征提取法提高2.41个百分点;采用“一对一”策略的分类能力明显优于“一对多”策略,其分类总精度最大可提高17.69个百分点。 3.一种新的组合分类方法,即将自相关函数特征提取法和支持向量机、以及本文提出的“改进的唯一的一对多”分类策略恰当组合,应用于蛋白质折叠子分类研究。结果显示:对于独立测试样本,自相关函数特征提取法的分类总精度比氨基酸组成成分特征提取法,大约可提高7个百分点;“改进的唯一的一对多”分类策略优于“一对多”策略,其独立测试和5CV检验的分类总精度,比“一对多”策略最大可分别提高约18和12个百分点。 4.引入加权思想,以一种新的特征提取法—加权自相关函数,表示蛋白质序列,并采用“一对多”、“一对一”分类策略对膜蛋白和亚细胞定位进行了分类和预测研究,结果有明显改善: 1).对于膜蛋白分类,在采用支持向量机算法及“一对多”分类策略下,加权自相关函数特征提取法的分类总精度为87.98%,比氨基酸组成成分特征提取
【学位单位】:西北工业大学
【学位级别】:博士
【学位年份】:2004
【中图分类】:Q51
【部分图文】:

示意图,结构层次,示意图,蛋白质结构


三级结构的概念【川,才使得蛋白质结构的研究有了质的飞跃。后来随着越来越多的蛋白质结构被测定,又提出了四级结构、超二级结构和结构域等概念[’2一,3]。图1.1为蛋白质四个层次结构示意图,图1.2以树状表示了蛋白质的结构层次及其关系。图1.2蛋自质结构层次关系示意图

【引证文献】

相关期刊论文 前1条

1 张振慧;王正华;王勇献;;基于分组重量编码的蛋白质同源寡聚体分类研究[J];国防科技大学学报;2007年02期

相关博士学位论文 前5条

1 李宏;面向应用领域的分类方法研究[D];中南大学;2007年

2 施建宇;蛋白质亚细胞定位特征表达与分类算法研究[D];西北工业大学;2006年

3 李凤敏;核蛋白的亚核定位和植物、非植物及小鼠蛋白质的亚细胞定位预测研究[D];内蒙古大学;2007年

4 胡秀珍;蛋白质的β-发夹、β(γ)-转角及四类简单超二级结构预测[D];内蒙古大学;2007年

5 刘辉;miRNA靶标预测的系统生物学方法研究[D];中国矿业大学;2009年

相关硕士学位论文 前6条

1 安文娟;Fisher和支持向量综合分类器[D];辽宁师范大学;2010年

2 曾聪;膜蛋白分类的特征提取算法和数据集构建技术研究[D];国防科学技术大学;2010年

3 曲娟;同源寡聚蛋白质的信息熵分类方法[D];大连理工大学;2006年

4 姜彬;膜蛋白分类问题的特征提取算法研究[D];国防科学技术大学;2008年

5 温欢;抗冻蛋白序列的模体分析与预测[D];内蒙古大学;2013年

6 红英;用支持向量机和离散增量方法预测人类血液分泌蛋白质[D];内蒙古大学;2013年



本文编号:2808814

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/shiyanyixue/2808814.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2d0a3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com