支持向量技术及其应用研究
发布时间:2018-04-18 21:37
本文选题:支持向量机 + 支持向量聚类 ; 参考:《大连海事大学》2016年博士论文
【摘要】:支持向量技术可用于解决机器学习中的分类(监督学习)和聚类分析(无监督学习)问题,其对应的方法分别为支持向量机(Support Vector Machine, SVM)和支持向量聚类(Support Vector Clustering, SVC)。支持向量机建立在统计学习理论的VC维(Vapnik Chervonenkis dimension)理论与结构风险最小化原则的基础之上,它能够根据有限样本信息在模型复杂度与学习能力之间寻求最佳折衷,具有较好的泛化性能。同时,支持向量机可以较好地解决困扰许多学习算法的小样本、非线性、过学习、高维数以及局部极值问题。支持向量聚类继承并推广了支持向量机的基本思想,是在无监督信息的环境下,使用支持向量技术进行类别学习的算法,它可以聚类具有任意簇形状的数据集,并无需预先给定聚类的数目。支持向量机与支持向量聚类技术在轮机故障诊断、场景分类等多个领域有着广阔的应用前景,其相关的研究,也得到了人们普遍的关注。本文针对基于支持向量的学习算法及其应用,作了如下几方面研究:1.针对基于决策树的多分类支持向量机其最优决策树结构难于确定,易产生误差累积影响分类准确率的问题,研究了一种基于遗传算法优化支持向量机决策树的多分类方法。以非线性支持向量机在高维特征空间中标准超平面的分类间隔最大化为目标,并将与其等价的目标函数作为遗传算法的适应度函数,采用轮盘赌选择,有序交叉、倒位变异三种操作算子,应用染色体实值编码的遗传算法来优化支持向量机决策树结构。该方法能将分类间隔大的类别尽早的划分开,从而减少误差累积。2.提出一种基于改进核主成分分析与线性支持向量机的分类算法。针对核主成分分析保留的主元只是依据其对数据信息总量的贡献率,而未考虑其是否有利于分类的问题,采用类间分离性测度,在核主成分分析基础上进一步提取具有更多类别信息量的主元,然后应用具有软间隔的线性支持向量机进行分类。将该方法应用于场景分类问题中,研究了一种基于局部Gabor特征的场景分类方法,在提取场景图像特征时,提出一种新的局部Gabor特征描述子,并将其嵌入视觉词包模型,然后在金字塔匹配框架下,提取塔式关键词直方图作为表示场景图像的特征向量,最后应用改进核主成分分析与线性支持向量机方法进行场景分类,通过对三个通用的场景数据集进行实验,结果表明该算法的有效性。3.提出一种新的基于多叶子生成树的支持向量聚类算法,采用并查集构建多叶子生成树,与最小生成树相比,该算法具有更快的执行速度,且该生成树拥有更多的叶子结点,其主干更为精简,然后只对多叶子生成树的主干进行连接关系检查,并据此生成聚类标定所需的邻接矩阵,最后采用深度优先搜索算法基于邻接矩阵进行聚类划分。鉴于样本点在高维特征空间中的分布由于经过非线性映射的优化,更加利于类别的划分,进一步将提出的算法扩展至高维特征空间,采用径向基核函数来计算样本点在高维特征空间中映像的欧氏距离,并以此作为边的权重,在希尔伯特空间构建多叶子生成树,再进行簇标定,获得了较好的效果。并将其应用于船舶柴油机故障诊断中,针对Kongsberg公司研发的MAN BW5L90MC大型油轮模拟器故障仿真数据进行了诊断实验。
[Abstract]:......
【学位授予单位】:大连海事大学
【学位级别】:博士
【学位授予年份】:2016
【分类号】:TP18;U672
【相似文献】
相关期刊论文 前10条
1 刘玉梅;李英;;一类简单图的生成树数[J];南通大学学报(自然科学版);2006年02期
2 罗鹏程;张晓航;赵p,
本文编号:1770189
本文链接:https://www.wllwen.com/kejilunwen/chuanbolw/1770189.html