基于特征选择和支持向量机的HIV-1型蛋白酶剪切位点预测
发布时间:2018-01-20 15:55
本文关键词: 生物物理学 剪切位点预测 特征选择 最小冗余最大相关 支持向量机 出处:《吉林大学学报(工学版)》2017年02期 论文类型:期刊论文
【摘要】:为了提高HIV-1型蛋白酶剪切位点的预测准确性,提出一种基于特征选择和支持向量机的剪切位点预测模型。首先,通过对5830个样本的HIV-1型蛋白酶剪切位点数据集进行分析,根据最小冗余最大相关理念,采用可自动终止法选择剪切位点的特征向量;然后,将特征向量输入到支持向量机进行学习和训练,建立HIV-1型蛋白酶剪切位点的分类模型;最后,采用Matlab 2014的仿真工具箱进行仿真测试。实验结果表明:本文模型在特征最少的条件下,剪切位点预测精度优于参比模型及文献报道,且所选择的特征向量具有较好的可解释性及生物学意义。
[Abstract]:In order to improve the accuracy of HIV-1 protease shear site prediction, a new shear site prediction model based on feature selection and support vector machine (SVM) was proposed. Based on the analysis of HIV-1 type protease shear site data set of 5830 samples, according to the minimum redundancy and maximum correlation concept, the feature vector of shear site is selected by automatic termination method. Then, the feature vector is input into support vector machine for learning and training, and the classification model of HIV-1 type protease shearing sites is established. Finally, Matlab 2014 simulation toolbox is used for simulation test. The experimental results show that the prediction accuracy of shear site is better than that of reference model and literature reports under the condition of the least characteristic. The selected feature vectors have good interpretability and biological significance.
【作者单位】: 湖南农业大学湖南省作物种质创新与资源利用重点实验室;湖南农业大学植物病虫害生物学与防控湖南省重点实验室;
【基金】:高等学校博士学科点专项科研基金项目(20124320110002) 长沙市科技计划项目(K1406018-21)
【分类号】:R373;TP18
【正文快照】: 0引言获得性免疫缺陷综合症(Acquired immunedeficiency syndrome,AIDS)由感染人类免疫缺陷病毒(Human immunodeficiency virus,HIV)引起。HIV病毒包含两型,在人类中传播的主要是HIV-1型。HIV-1蛋白酶对HIV-1病毒的复制必不可少,高效HIV-1蛋白酶抑制剂是当前临床治疗艾滋病的
【相似文献】
相关期刊论文 前3条
1 邵壮超;张绍武;潘泉;施建宇;姜涛;;基于一种动态特征选择融合算法的蛋白质结构类预测[J];世界科技研究与发展;2005年06期
2 刘峤;王娟;陈伟;秦志光;;用于全基因组关联分析的一种基因自动选择算法研究[J];航天医学与医学工程;2010年04期
3 ;[J];;年期
相关博士学位论文 前3条
1 王爱国;微阵列基因表达数据的特征分析方法研究[D];合肥工业大学;2015年
2 张明锦;基于特征选择的多变量数据分析方法及其在谱学研究中的应用[D];华东理工大学;2011年
3 高青斌;蛋白质亚细胞定位预测相关问题研究[D];国防科学技术大学;2006年
相关硕士学位论文 前5条
1 皮阳;基于声音的生物种群识别[D];电子科技大学;2015年
2 张弘杨;HIV-1蛋白酶剪切位点预测与膜蛋白分类[D];湖南农业大学;2016年
3 魏莎莎;基因表达数据的特征选择及其分类算法研究[D];中国计量学院;2015年
4 赵剑;基于互信息频度的特征选择及其在SNP关联分析中的应用[D];西安电子科技大学;2009年
5 李海燕;互信息特征选择的研究及在代谢组学中的应用[D];大连理工大学;2010年
,本文编号:1448788
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1448788.html