基于主成分分析和递归特征消除的支持向量机分类方法研究
本文关键词:基于主成分分析和递归特征消除的支持向量机分类方法研究
更多相关文章: 支持向量机 主成分分析法 递归特征消除法 分类 生物医疗数据
【摘要】:随着计算机技术的不断发展,用智能算法处理大数据已经成为了一种必然的趋势。支持向量机是一种被广泛应用的智能算法,因为其具有优秀的泛化能力,小样本决策能力和处理非线性数据的能力。统计学习理论的优势在于以小样本为研究对象时效果极佳,而支持向量机则是统计学习理论经过发展和延伸所得到的产物,一种学习机器。最近几年,支持向量机发展迅速,并且产生了例如LS-SVM、LIB-SVM等算法。这些新算法使支持向量机的应用范围更加广阔,例如时间序列建模、前馈控制、优化控制等。同时,一些智能控制算法存在着一些缺点和不足,如神经网络智能控制算法存在算法可能不收敛、局部最优化导致解的不唯一、结构较难选取等问题。相比之下,支持向量机具有泛化能力好,非线性建模能力强等特点,适合处理大时延和非线性系统的问题。当然支持向量机也存在着一定的不足,希望在不久的将来可以变得更加完美。生物医学数据是非线性且十分复杂的数据。采用合适的算法对该数据进行准确分类,从而辅助医生对病人的病情做出正确的判断是十分必要的。由于生物医学数据的维数较高,从而本文用支持向量机结合主成分分析和递归特征消除的方法来对生物医学数据进行分类。本文首先介绍了支持向量机、主成分分析以及递归特征消除方法的基本理论并介绍了其建模方法。对于维数十分高的生物医学数据,本文采用主成分分析对其进行预处理,使其维数降低以提高支持向量机的分类准确率。另外,递归特征消除法是本文采用的另外一种降维方法,对该数据进行预处理。其效果与主成分分析相当。上述的两种方法都能有效的提取高维数据中最为主要的几个变量,使得支持向量机在后续对其分类时计算量减小、计算时间缩短以及准确率提高。本文最后用上述的三种方法对生物医学数据进行仿真并对其结果进行分析比较。其结果证明,对于生物医疗数据支持向量机是一种十分有效的分类方法。
【关键词】:支持向量机 主成分分析法 递归特征消除法 分类 生物医疗数据
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:R318;TP18
【目录】:
- 摘要4-5
- ABSTRACT5-8
- 第1章 绪论8-18
- 1.1 课题背景以及研究目的和意义8
- 1.2 国内外研究现状8-16
- 1.2.1 生物医学数据国内外研究现状8-9
- 1.2.2 支持向量机的研究现状9-14
- 1.2.3 基于递归特征消除法的支持向量机(SVM-RFE)研究现状14-15
- 1.2.4 主成分分析研究现状15-16
- 1.3 本文的主要研究内容16-18
- 第2章 支持向量机18-31
- 2.1 统计学习理论简介18-21
- 2.1.1 学习问题18-19
- 2.1.2 经验风险19
- 2.1.3 VC维19-20
- 2.1.4 结构风险20-21
- 2.2 支持向量机21-25
- 2.2.1 支持向量机分类21-23
- 2.2.2 支持向量机函数拟合23-25
- 2.3 核函数25-29
- 2.3.1 研究现状25-26
- 2.3.2 支持向量机中的核函数26-27
- 2.3.3 高斯核函数27-28
- 2.3.4 高斯核函数的参数选择28-29
- 2.4 支持向量机的优点29-30
- 2.5 本章小结30-31
- 第3章 特征选择方法31-38
- 3.1 特征选择方法的概念和意义31-32
- 3.2 特征选择算法32-34
- 3.2.1 按照评价标准分类32-33
- 3.2.2 按照搜索策略分类33-34
- 3.3 特征选择方法的选取原则34-35
- 3.3.1 影响因素34
- 3.3.2 选取准则34-35
- 3.4 SVM-RFE算法35-37
- 3.5 本章小结37-38
- 第4章 主成分分析38-46
- 4.1 引言38
- 4.2 主成分分析的几何意义38-39
- 4.3 主成分分析的主要思想39-41
- 4.4 主元分析法及其相关内容41-45
- 4.4.1 主元的定义与求取41-42
- 4.4.2 主元得分向量和主元模型的建立42-43
- 4.4.3 主元个数的确定43-44
- 4.4.4 两个关键的检测统计量44-45
- 4.5 本章小结45-46
- 第5章 生物医学数据的数据挖掘46-60
- 5.1 简介46
- 5.2 数据预处理46-47
- 5.3 生物医学数据的特点47-48
- 5.4 乳腺癌数据分析48-58
- 5.4.1 经典SVM对乳腺癌数据分类51-53
- 5.4.2 SVM-RFE对乳腺癌数据分类53-55
- 5.4.3 PCA对乳腺癌数据分类55-58
- 5.5 仿真结果分析58
- 5.6 本章小结58-60
- 结论60-62
- 参考文献62-70
- 攻读硕士学位期间发表的论文及其它成果70-72
- 致谢72
【相似文献】
中国期刊全文数据库 前10条
1 冯剑丰;王洪礼;李胜朋;;基于支持向量机的浮游植物密度预测研究[J];海洋环境科学;2007年05期
2 蔡佳;陈洪;;ν-支持向量机的收敛性[J];湖北大学学报(自然科学版);2005年04期
3 唐万梅;;基于灰色支持向量机的新型预测模型[J];系统工程学报;2006年04期
4 熊宇虹;温志渝;梁玉前;陈勤;张波;刘妤;向贤毅;;基于支持向量机的模型传递方法研究[J];光谱学与光谱分析;2007年01期
5 左林;;一个新的稀疏支持向量机模型[J];山西师范大学学报(自然科学版);2008年03期
6 赫英明;王汉杰;;支持向量机在积雪检测中的应用[J];南京气象学院学报;2009年01期
7 贾亮;王礼力;;支持向量机在上市公司财务预警模型中的应用[J];淮阴工学院学报;2010年02期
8 郎宇宁;蔺娟如;;基于支持向量机的多分类方法研究[J];中国西部科技;2010年17期
9 谢福民;;支持向量机理论研究[J];科技广场;2011年01期
10 王红蔚;席红旗;孔波;;一种新的半监督支持向量机[J];郑州大学学报(理学版);2012年03期
中国重要会议论文全文数据库 前10条
1 余乐安;姚潇;;基于中心化支持向量机的信用风险评估模型[A];第六届(2011)中国管理学年会——商务智能分会场论文集[C];2011年
2 刘希玉;徐志敏;段会川;;基于支持向量机的创新分类器[A];山东省计算机学会2005年信息技术与信息化研讨会论文集(一)[C];2005年
3 史晓涛;刘建丽;骆玉荣;;一种抗噪音的支持向量机学习方法[A];全国第19届计算机技术与应用(CACIS)学术会议论文集(下册)[C];2008年
4 何琴淑;刘信恩;肖世富;;基于支持向量机的系统辨识方法研究及应用[A];中国力学大会——2013论文摘要集[C];2013年
5 刘骏;;基于支持向量机方法的衢州降雪模型[A];第五届长三角气象科技论坛论文集[C];2008年
6 王婷;胡秀珍;;基于组合向量的支持向量机方法预测膜蛋白类型[A];第十一次中国生物物理学术大会暨第九届全国会员代表大会摘要集[C];2009年
7 赵晶;高隽;张旭东;谢昭;;支持向量机综述[A];全国第十五届计算机科学与技术应用学术会议论文集[C];2003年
8 周星宇;王思元;;智能数学与支持向量机[A];2005年中国智能自动化会议论文集[C];2005年
9 颜根廷;马广富;朱良宽;宋斌;;一种鲁棒支持向量机算法[A];2006中国控制与决策学术年会论文集[C];2006年
10 侯澍e,
本文编号:868198
本文链接:https://www.wllwen.com/yixuelunwen/swyx/868198.html