动态粒度支持向量机分类模型

发布时间:2022-08-07 19:58
  随着信息时代的飞速发展,各种数据呈现出爆炸式的增长态势。同时,数据形式也变得复杂且多样,给以机器学习为核心技术的数据挖掘带来了极大的挑战。其中,数据的海量性和数据的非平衡性是数据的两类重要特性。大规模数据具有数据量特别大或数据类别特别多的特点,这导致传统机器学习方法在处理大规模数据时需要消耗大量的时间,效率低下,特别是在资源受限的情况下。非平衡数据主要表现为样本数量的显著不平衡性。传统的机器学习模型无法高效地区分少数类样本,甚至无法识别少数类样本。目前,针对数据的大规模性和非平衡性,许多学者已经提出了一些相关的解决方法,但仍然存在一定的局限。一是大规模数据分类的时间消耗仍然较大;二是非平衡数据分类的综合性能较差,即少数类样本的分类准确率较低,且会影响多数类样本的分类准确率。因此,对于大规模非平衡数据的建模方法研究仍具有重要的应用价值。本文以支持向量机模型(Support Vector Machine,SVM)为基础学习模型,结合动态粒度划分方法,分别对大规模数据和非平衡数据的建模开展研究,主要工作包括以下内容。(1)对于大规模数据分类问题,提出一种采用划分融合双向控制的粒度支持向量机方... 

【文章页数】:73 页

【学位级别】:硕士

【文章目录】:
中文摘要
ABSTRACT
第一章 引言
    1.1 研究背景
    1.2 国内外研究现状
    1.3 论文的主要内容
    1.4 论文结构
第二章 背景知识
    2.1 支持向量机
    2.2 粒度支持向量机
    2.3 SMOTE过采样方法
    2.4 本章小结
第三章 采用划分融合双向控制的粒度支持向量机
    3.1 DFSVM算法
        3.1.1 DFSVM算法原理
        3.1.2 DFSVM算法步骤
    3.2 实验结果及分析
        3.2.1 实验环境及数据
        3.2.2 实验结果及分析
    3.3 本章小结
第四章 结合SMOTE采样的非平衡粒度支持向量机
    4.1 CSGSVM算法
        4.1.1 CSGSVM算法原理
        4.1.2 CSGSVM算法步骤
    4.2 实验结果及分析
        4.2.1 实验环境及数据
        4.2.2 实验结果及分析
    4.3 本章小结
第五章 总结与展望
参考文献
攻读学位期间取得的研究成果
致谢
个人简况及联系方式


【参考文献】:
期刊论文
[1]基于知识语义权重特征的朴素贝叶斯情感分类算法[J]. 冀俊忠,张玲玲,吴晨生,吴金源.  北京工业大学学报. 2014(12)
[2]动态粒度支持向量回归机[J]. 郭虎升,王文剑.  软件学报. 2013(11)
[3]聚类边界过采样不平衡数据分类方法[J]. 楼晓俊,孙雨轩,刘海涛.  浙江大学学报(工学版). 2013(06)
[4]粒度支持向量机学习模型[J]. 王文剑,郭虎升.  山西大学学报(自然科学版). 2009(04)



本文编号:3670948

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3670948.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a46f8***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com