当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于多核SVM的蛋白质结构类预测

发布时间:2021-12-17 12:03
  蛋白质的空间结构决定了其生物学功能,识别和预测蛋白质结构类有助于进一步了解更高层次的蛋白质结构特征,为蛋白质的功能研究及其相关药物设计提供了重要线索。常规的生物实验方法可以识别蛋白质结构类,但成本较高无法满足大规模蛋白质结构类分析的需求。利用蛋白质序列信息矢量表示和机器学习算法来预测蛋白质结构类,可以解决大规模蛋白质结构分析任务。为了提高蛋白质结构类预测的准确率,本文主要对蛋白质序列特征提取和多核学习等内容展开研究。使用多种特征提取方式对蛋白质氨基酸序列进行特征融合,然后采用多核支持向量机方法来识别和预测蛋白质结构类别。主要工作内容如下:(1)构建了一个多信息融合的蛋白质序列组合特征集。针对蛋白质序列特征表示,分析了多类特征提取方法,包括氨基酸组分、多肽组分、伪氨基酸组分和平均化学位移,以及低方差过滤、主成分分析等多类特征选择方法。首先采用 PseAAC(Pseudo Amino Acid Composition)、DPC(Dipeptide Composition)、OTC(Optimal Tripeptide Composition)、和ACS(Average Chemical S... 

【文章来源】:陕西科技大学陕西省

【文章页数】:68 页

【学位级别】:硕士

【部分图文】:

基于多核SVM的蛋白质结构类预测


图4-2蛋白质序列样本??Fig.?4-2?Sample?of?protein?sequence??

曲线,降维,曲线,主成分分析


过多有效信息的OTC无法完成蛋白质序列的信息表征,因此使用主成分分析对??OTC特征进行降维,降维产生了新的特征且包含所有原特征的信息。??1?f?i?—?C?C?C?C?t?"T??0.8?[■?/?J??运?i??*5?/??5〇.6'?/?-??堪?/??HEn?/??mn,?I?」??忪0勺??坦?I??#?丨??0.2?j?-??°0?1000?2000?3000?4000?5000?6000?7000?8000??特征维数??图4-3?OTC特征降维后贡献值曲线??Fig.?4-3?Contribution?curve?of?OTC?feature?after?dimension?reduction??图4-3中横坐标是主成分分析对OTC特征降维后的维数,横坐标是特征降维后的方??差信息贡献率的综合。由图4-3可知,OTC特征降维至3000维时,方差贡献率综合可??达到0.99,这意味着主成分分析方法将OTC特征降维至3000时,去除信息噪音和冗余??27??

基于多核SVM的蛋白质结构类预测


图4>4?DPC特征热图??Fig.?4-4?DPC?feature?heat?map??

【参考文献】:
期刊论文
[1]基于卷积长短时记忆神经网络的蛋白质二级结构预测[J]. 郭延哺,李维华,王兵益,金宸.  模式识别与人工智能. 2018(06)
[2]蛋白质中残基远程相互作用预测算法研究综述[J]. 张海仓,高玉娟,邓明华,郑伟谋,卜东波.  计算机研究与发展. 2017(01)
[3]基于AFSA-SimpleMKL对振动筛建模及筛机优化[J]. 李占福,童昕.  工程设计学报. 2016(02)
[4]基于有向双关系图和多核融合的蛋白质功能预测[J]. 孟军,刁印.  计算机应用. 2014(12)
[5]蛋白质二级结构预测的多核学习方法[J]. 连云涓,熊惠霖.  计算机应用. 2013(S1)
[6]基于混合SVM方法的蛋白质二级结构预测算法[J]. 隋海峰,曲武,钱文彬,杨炳儒.  计算机科学. 2011(10)
[7]蛋白质结构分类与结构类预测研究[J]. 张春霆.  中国科学基金. 2000(05)

博士论文
[1]基于群智能算法的蛋白质结构预测研究[D]. 陈烨.中国矿业大学 2018
[2]基于群智能方法的蛋白质结构预测研究[D]. 张岩.上海交通大学 2016
[3]蛋白质结构类与亚细胞定位预测中的特征提取方法研究[D]. 梁芸芸.西安电子科技大学 2017
[4]多核学习算法研究[D]. 刘新旺.国防科学技术大学 2013
[5]基因数据信息分析方法及应用研究[D]. 吴蓉晖.湖南大学 2012
[6]进化分析与结构预测中的若干问题研究[D]. 丁淑妍.大连理工大学 2012
[7]蛋白质与RNA中的若干问题研究[D]. 张胜利.大连理工大学 2011
[8]基于智能计算的膜蛋白结构与相互作用预测研究[D]. 赵培英.东华大学 2010
[9]基于支持向量机的蛋白质结构域预测方法研究[D]. 邹淑雪.吉林大学 2009

硕士论文
[1]基于多核学习的蛋白质序列分类问题的研究与应用[D]. 连秋雨.电子科技大学 2019
[2]面向流数据的多任务多核在线学习算法研究[D]. 裴乐.重庆邮电大学 2018
[3]基于多种特征的低序列相似性蛋白质结构类预测[D]. 朱小娟.电子科技大学 2018
[4]多核支持向量机在高分辨率遥感影像分类中的应用研究[D]. 李洪川.重庆邮电大学 2018
[5]基于主成分分析算法与多核支持向量机人脸识别方法研究[D]. 迟明伟.哈尔滨理工大学 2018
[6]机器学习算法在蛋白质结构预测中的应用[D]. 薛燕娜.江南大学 2016
[7]基于奇异值分解的信号处理关键技术研究[D]. 聂振国.华南理工大学 2016



本文编号:3540080

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3540080.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户926e7***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com