当前位置:主页 > 医学论文 > 临床医学论文 >

基于模糊聚类的多核支持向量机研究及其应用

发布时间:2020-11-14 00:09
   支持向量机作为机器学习的研究方法之一,已得到了深入研究和广泛应用,由于基于单核函数的支持向量机已不适应于复杂的大规模数据处理,因此多核支持向量机成为研究热点。本文介绍了多核支持向量机的原理,以及多核支持向量机的研究成果,并在加权多核支持向量机聚类的基础上,先针对特征的来源选取合适的核函数,再针对不同的特征来源对各个核函数进行线性拟合,提出了基于模糊聚类的多核支持向量机算法。实验结果分析表明,基于模糊聚类的简化多核支持向量机能显著提高多核支持向量机的学习效率,尤其是在大规模训练数据集上效果尤为明显。模糊C均值聚类算法(FCM)是数据聚类分析的主要流行算法之一,为了解决传统的FCM算法对于非欧式结构的数据聚类结果不理想的问题,已经有多种解决方案。本文首先依据特征来源选取核函数,对应特征集形成了核函数集。为了更好的进行聚类,针对核函数集的权重,采取自适应的特征加权FCM算法确定之。在目标函数中引入核函数集,形成了一种新的基于核函数的模糊C均值聚类算法(KFCM),其通过借助核函数重新构造新的目标函数,进而获取更好的聚类效果。心电图(ECG)是诊断心脏疾病、评价心脏功能的主要依据之一。本文采用KFCM算法,对ECG信号进行分析。本文中的心电图数据均采集于MIT-BIH心律失常标准数据库,且对原始的心电数据进行校准基线漂移和去除高频噪声的预处理。一般的心电图数据都是高维数据,其中包含许多的冗余信息,不利于数据的聚类。为了提高聚类效果:一方面,通过相关性分析的方法进行数据预处理;另一方面,通过提取原始心电图数据的特征值对数据做降维处理。流行学习是数据非线性降维的主要方法之一,本文尝试采用了流行学习中的局部线性嵌入算法(LLE)对进过预处理的心电数据进行了降维。为了比较降维效果,同时也用经典的主成分分析法(PCA)对数据进行了降维,然后对二种方法降维后的心电数据分别用FCM算法和新的KFCM算法进行了聚类,并对聚类效果和计算量做了比较和分析。从实验结果来看,LLE算法对心电数据的特征提取并没有PCA算法效果好,且KFCM算法受核函数及其参数选择的影响,聚类效果也没有FCM算法稳定和优异,但KFCM的计算量比FCM要小很多,能够更快的得到聚类结果,其结果较好。
【学位单位】:武汉纺织大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:R540.41;TP181;TP311.13;TN911.7
【部分图文】:

示意图,示意图,心脏,心动周期


2.1 心电图简介ECG 是心脏产生的电信号的记录。它通过变化的连续记录反映了心肌中的循环电生理事件。 这是一种非侵入性的有关心脏的有用信息,评估功能,诊断和治疗计划的临床试验。心电图是在世界上使用最广泛的测试之一。在正常人体中,潜在的变化首先在心脏收缩之前发生,并且心电图(ECG)变化从心脏的开始开始,即窦房结。根据一定的路线和时间表,它依次传递到心房和心室,这使整个心脏兴奋。因此,在每个心动周期中,心脏各部位的激发的电变化及其时间顺序,方向和路径具有一定的规律性。放置在身体一部分中的体表电极可以记录在 ECG 曲线上,称为 ECG。ECG 通常使用 ECG 采集仪器(例如 ECG 监测器)来记录人类心脏电位的变化并将其应用于临床心脏监测/诊断可见图形记录。在心电图中,一组连续发生的 P 波,QRS 波群,T 波和 U 波表示完整的心动周期(也称为心跳),心电图由重复的心动周期组成(文献[1])。关于 ECG 的最重要信息集中在 P 波,QRS 波和 T 波上。这些信息主要包含:P- QRS- T 波的振幅、 P波间期、 PR 间期、 PR 段、 QRS 间期、 ST 段、ST 间隔,T 波间隔,QT 间隔和计算这些间隔所需的 P-QRS-T 边界点位置,如图 2.1 所示,图 2.2 是实际收缩前的情况。

心电图,房性早搏,心电图,采样率


如图 2.1 所示,图 2.2 是实际收缩前的情况。图 2.1 心电图波形示意图2.2 心电图特征选取及特征提取ECG 的有效带宽和足够的采样率是非常关键的两个特征。 尽管对处理过程没有任何影响,但在机器记录信号时确定记录 ECG 的采样率。 因此,需要重点关注,使用适当的采样率。选用 250 Hz 而不是 500 Hz 的采样率不会导致显着差异,但是如果降低到 125Hz,滤除信号的频率成分的现象变得非常严重,并且心电图的峰值和振幅都会显著的降低。

简单图,聚类分析


…, ,并且令U = , ,…, 。tep4: 求得高维样本数据 所对应的低维坐标 ∈ := ( ), = 1,2,…, 聚类分析 聚类分析的概念类分析是数据挖掘的重要方法。因此,我们需要根据各自的特征对大量样分类。然聚类也可以在分类中发挥作用,但它与大多数分类不同。大多数分类方法,即人们预先确定某些事物的分类标准或每个类别的标准。然后对这些,以确定该项目的分类标准或每个类别的标准是或多或少主观的。聚类分类似的基础上划分给定的数据集。这种划分应满足以下两个特性:1) 类内相似性:属于同一类的数据应尽可能相似。2) 类间相异性:属于不同类的数据应尽可能相异。图 3.1 是一个简单聚类
【参考文献】

相关期刊论文 前5条

1 张兴福;黄少滨;;自适应近邻的局部线性嵌入算法[J];哈尔滨工程大学学报;2012年04期

2 曾山;同小军;桑农;李蓉烨;;基于对应分析的冗余模糊C均值聚类算法研究[J];华中科技大学学报(自然科学版);2012年02期

3 顾亚祥;丁世飞;;支持向量机研究进展[J];计算机科学;2011年02期

4 丁世飞;齐丙娟;谭红艳;;支持向量机理论与算法研究综述[J];电子科技大学学报;2011年01期

5 王丽苹;董军;;心电图模式分类方法研究进展与分析[J];中国生物医学工程学报;2010年06期


相关硕士学位论文 前2条

1 黄荣;统计方法在由心电图判别疾病中的应用[D];华东师范大学;2014年

2 谢秋玲;应用于心电图分类的KNN和SVM分类器研究[D];华东师范大学;2004年



本文编号:2882820

资料下载
论文发表

本文链接:https://www.wllwen.com/linchuangyixuelunwen/2882820.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b6478***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com