基于类划分和近邻选取的k近邻算法研究
发布时间:2021-05-18 08:23
在大数据时代,怎样从海量数据中挖掘出有用信息已经成为大众广泛关注的一个焦点问题,数据挖掘技术为解决该问题提供了一个有效途径。数据分类是数据挖掘中的一个重要方法,其中k近邻分类算法凭借其简单、易操作等优点被人们广泛应用。但与此同时,k近邻分类算法也存在着对k值选取敏感、易受不平衡数据影响和距离度量选取过于简单等问题。本文主要在k近邻分类算法和基于局部均值的k近邻分类算法的基础上,利用群智能优化和稀疏表示等技术对k近邻分类算法进行改进,来克服原始算法的一些缺陷,进而提升算法的分类性能。具体研究内容和研究结果如下:1.针对基本的蚱蜢优化算法易陷入局部最优和收敛精度不高等问题,提出了一种改进的蚱蜢优化算法。首先,利用混沌反向学习初始化策略,产生了一群较优的初始种群;利用自然指数递减策略,平衡了算法的勘测和开发能力;利用高斯变异策略,克服了算法的易陷入局部最优的问题。然后,利用10个基准测试函数进行实验,结果表明,改进的算法具有较高的收敛效率和求解精度。最后,针对距离加权k近邻算法对距离度量的依赖性过高,生成的权重具有一定的随机性等问题,提出了一种基于改进的蚱蜢优化算法的距离加权k近邻算法,利用...
【文章来源】:西安理工大学陕西省
【文章页数】:79 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景与意义
1.1.1 研究背景
1.1.2 研究意义
1.2 国内外研究现状
1.2.1 k近邻算法国内外研究现状
1.2.2 蚱蜢优化算法国内外研究现状
1.3 本文主要研究工作
1.4 本文组织结构
2 预备知识
2.1 k近邻分类算法及其相关概念
2.1.1 基本概念
2.1.2 邻近度度量
2.1.3 评价方法和指标
2.2 蚱蜢优化算法
2.2.1 蚱蜢优化算法的基本概念
2.2.2 蚱蜢优化算法的应用领域
2.3 本章小结
3 基于改进的蚱蜢优化算法的距离加权k近邻算法
3.1 改进的蚱蜢优化算法
3.1.1 算法的基本思想
3.1.2 混沌反向学习初始化策略
3.1.3 自然指数递减策略
3.1.4 高斯变异策略
3.1.5 改进算法的描述
3.1.6 IGOA的实验与分析
3.2 基于改进的蚱蜢优化算法的距离加权k近邻算法
3.2.1 算法的基本思想
3.2.2 距离加权的k近邻算法
3.2.3 算法的基本描述
3.2.4 IGOA-DWKNN的实验与分析
3.3 本章小结
4 基于互信息相关度和局部均值的k近邻改进算法
4.1 算法的基本思想
4.1.1 基于互信息相关度的属性权重
4.1.2 基于局部均值的类划分策略
4.1.3 算法步骤
4.2 实验结果与分析
4.2.1 实验目的
4.2.2 实验结果
4.3 本章小结
5 基于属性加权和稀疏系数的调和近邻算法
5.1 算法的基本思想
5.2 基于属性权重和稀疏系数的调和近邻算法
5.2.1 相关概念
5.2.2 综合属性权重
5.2.3 两步近邻选取策略
5.2.4 近邻样本代表性分析
5.2.5 算法步骤
5.3 实验与分析
5.3.1 实验环境
5.3.2 标准数据集
5.3.3 含噪数据集
5.3.4 Wilcoxon符号秩检验
5.3.5 算法复杂度分析
5.4 本章小结
6 总结与展望
6.1 主要研究结果
6.2 展望
致谢
参考文献
攻读硕士学位期间主要研究成果
【参考文献】:
期刊论文
[1]基于改进K-modes聚类的KNN分类算法[J]. 王志华,刘绍廷,罗齐. 计算机工程与设计. 2019(08)
[2]改进多元宇宙算法求解大规模实值优化问题[J]. 刘小龙. 电子与信息学报. 2019(07)
[3]基于聚类的环形kNN算法[J]. 匡振曦,武继刚,李嘉兴. 计算机工程与科学. 2019(05)
[4]基于GOA-SVM的短期负荷预测[J]. 宫毓斌,滕欢. 电测与仪表. 2019(14)
[5]KNN算法综述[J]. 窦小凡. 通讯世界. 2018(10)
[6]模型决策树:一种决策树加速算法[J]. 尹儒,门昌骞,王文剑,刘澍泽. 模式识别与人工智能. 2018(07)
[7]基于类别信息熵加权的MKNN算法[J]. 陈雪云,刘艳芳,柯婷,张剑楠. 数码设计. 2017(01)
[8]卷积神经网络研究综述[J]. 周飞燕,金林鹏,董军. 计算机学报. 2017(06)
[9]大数据关联关系度量研究综述[J]. 钱宇华,成红红,梁新彦,王建新. 数据采集与处理. 2015(06)
[10]用于大数据分类的KNN算法研究[J]. 耿丽娟,李星毅. 计算机应用研究. 2014(05)
硕士论文
[1]基于蚱蜢优化和最小二乘支持向量机的电力负荷预测研究[D]. 张育凡.兰州大学 2018
[2]基于互信息的属性选择算法研究[D]. 郭衍奎.北京交通大学 2015
本文编号:3193473
【文章来源】:西安理工大学陕西省
【文章页数】:79 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景与意义
1.1.1 研究背景
1.1.2 研究意义
1.2 国内外研究现状
1.2.1 k近邻算法国内外研究现状
1.2.2 蚱蜢优化算法国内外研究现状
1.3 本文主要研究工作
1.4 本文组织结构
2 预备知识
2.1 k近邻分类算法及其相关概念
2.1.1 基本概念
2.1.2 邻近度度量
2.1.3 评价方法和指标
2.2 蚱蜢优化算法
2.2.1 蚱蜢优化算法的基本概念
2.2.2 蚱蜢优化算法的应用领域
2.3 本章小结
3 基于改进的蚱蜢优化算法的距离加权k近邻算法
3.1 改进的蚱蜢优化算法
3.1.1 算法的基本思想
3.1.2 混沌反向学习初始化策略
3.1.3 自然指数递减策略
3.1.4 高斯变异策略
3.1.5 改进算法的描述
3.1.6 IGOA的实验与分析
3.2 基于改进的蚱蜢优化算法的距离加权k近邻算法
3.2.1 算法的基本思想
3.2.2 距离加权的k近邻算法
3.2.3 算法的基本描述
3.2.4 IGOA-DWKNN的实验与分析
3.3 本章小结
4 基于互信息相关度和局部均值的k近邻改进算法
4.1 算法的基本思想
4.1.1 基于互信息相关度的属性权重
4.1.2 基于局部均值的类划分策略
4.1.3 算法步骤
4.2 实验结果与分析
4.2.1 实验目的
4.2.2 实验结果
4.3 本章小结
5 基于属性加权和稀疏系数的调和近邻算法
5.1 算法的基本思想
5.2 基于属性权重和稀疏系数的调和近邻算法
5.2.1 相关概念
5.2.2 综合属性权重
5.2.3 两步近邻选取策略
5.2.4 近邻样本代表性分析
5.2.5 算法步骤
5.3 实验与分析
5.3.1 实验环境
5.3.2 标准数据集
5.3.3 含噪数据集
5.3.4 Wilcoxon符号秩检验
5.3.5 算法复杂度分析
5.4 本章小结
6 总结与展望
6.1 主要研究结果
6.2 展望
致谢
参考文献
攻读硕士学位期间主要研究成果
【参考文献】:
期刊论文
[1]基于改进K-modes聚类的KNN分类算法[J]. 王志华,刘绍廷,罗齐. 计算机工程与设计. 2019(08)
[2]改进多元宇宙算法求解大规模实值优化问题[J]. 刘小龙. 电子与信息学报. 2019(07)
[3]基于聚类的环形kNN算法[J]. 匡振曦,武继刚,李嘉兴. 计算机工程与科学. 2019(05)
[4]基于GOA-SVM的短期负荷预测[J]. 宫毓斌,滕欢. 电测与仪表. 2019(14)
[5]KNN算法综述[J]. 窦小凡. 通讯世界. 2018(10)
[6]模型决策树:一种决策树加速算法[J]. 尹儒,门昌骞,王文剑,刘澍泽. 模式识别与人工智能. 2018(07)
[7]基于类别信息熵加权的MKNN算法[J]. 陈雪云,刘艳芳,柯婷,张剑楠. 数码设计. 2017(01)
[8]卷积神经网络研究综述[J]. 周飞燕,金林鹏,董军. 计算机学报. 2017(06)
[9]大数据关联关系度量研究综述[J]. 钱宇华,成红红,梁新彦,王建新. 数据采集与处理. 2015(06)
[10]用于大数据分类的KNN算法研究[J]. 耿丽娟,李星毅. 计算机应用研究. 2014(05)
硕士论文
[1]基于蚱蜢优化和最小二乘支持向量机的电力负荷预测研究[D]. 张育凡.兰州大学 2018
[2]基于互信息的属性选择算法研究[D]. 郭衍奎.北京交通大学 2015
本文编号:3193473
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3193473.html
最近更新
教材专著