当前位置:主页 > 科技论文 > 自动化论文 >

基于改进KNN算法的图像分类研究

发布时间:2021-06-30 06:59
  机器学习是当前大数据处理中的重要方法和手段,利用机器学习来处理图像分类是当前学者们研究的热点。在图像分类处理技术方面已经催生了许多成熟而有效的机器学习算法,其中K近邻算法(KNN)简单、直观且理论上比较成熟,是最简易的机器学习方法之一,但也存在处理图像分类时分类准确率不够高、运算效率较低等缺点。本研究旨在提高图像分类算法的分类准确率和运算效率,分别提出了三种基于改进KNN算法的图像分类算法。首先提出了一种基于K值选取策略的改进KNN算法。在改进算法中增加了两种分类决策规则,达到提高分类准确率的效果。其次提出了一种基于K均值聚类模型的KNN算法。在分类处理前对训练样本进行优化处理,然后通过K均值聚类方法把样本聚为不同的子类,每一个子类以聚类中心为新样本点构建新数据集,达到压缩样本量的效果,从而减少了运算量提高了运算效率。最后提出了一种基于并行计算模式的改进KNN算法。该算法构建并行计算模式,让整个分类算法分布式并行进行,在保持或提高分类准确率的情况下大幅度提高了运算速度。 

【文章来源】:贵州民族大学贵州省

【文章页数】:53 页

【学位级别】:硕士

【部分图文】:

基于改进KNN算法的图像分类研究


pd距离间关系图

流程图,新训,数据分类,聚类


贵州民族大学2020届硕士研究生学位论文29续图4.2基于K均值聚类的改进KNN算法流程图(新训练数据分类)2.改进算法原理步骤:(1)收集、准备数据,提取特征;(2)将数据集中大部分数据作为训练数据集,并构建训练样本集合X,nixXR,其中nR为n维空间,ix为第i个样本,i=1,2,,N,余下少部分数据作为测试样本,用于验证训练好的模型;(3)统计训练数据集中样本类别c的数量及每类样本个数m,记为12{,,,}kc=ccc,12{,,,}km=mmm,共k类;(4)计算每类样本中心u,11jmljjluxm==,其中jm为第j类的样本个数,lx表示属于ju(即jc)这个类别的样本点。所有类的中心点记为12{,,,}ku=uuu;(5)遍历每类里所有样本,计算每类所有样本到其样本中心的距离,(,)llljjjd=dux=ux,其中ljd表示jc类中第l个样本lx与中心点ju的距离,在每类中删除少部份与该类中心点距离大的该类里的样本;(6)从1~k中遍历每类所有样本,对每类通过k均值聚类方法聚成n类(n值大小根据训练集本样数量及分类效果确定和调整),即得到每大类的样本子类,记为{1,2,,n}jjjjc=ccc,即2jc表示第jc大类的第2子类;差优设定K的初始值计算K个邻居确定样本点类别判断分类效果最终分类结果修改K值

架构图,架构,算法,计算机


贵州民族大学2020届硕士研究生学位论文34图5.1传统KNN算法架构图5.2并行KNN算法架构图5.1为传统的KNN算法架构,所有分类过程都在同一台计算机上的单程序单线程中完成,图5.2为改进后的并行算法架构,需先准备n台计算机,把数据集样本平均分成n份,即12,X,nijX=XXXX=ij,并每一台计算机送一份,每台计算机同时计算出K个邻居样本后把计算结果送回主机,主机将收到的n*K个近邻选出K个最近邻,在K个近邻中判定最多的类别为新数据类别。新数据全体训练集合X计算机AK个最近邻新数据K个最近邻计算机B训练集X1计算机B1训练集X2计算机B2计算机Bn训练集Xn

【参考文献】:
期刊论文
[1]一种基于特征聚类分析的商品评论系统设计[J]. 尹积栋,刘红,谢茶花,张慧,曾炎.  信息技术与信息化. 2019(10)
[2]基于非负矩阵分解算法的人脸识别方法[J]. 彭梦冉.  长春工程学院学报(自然科学版). 2019(03)
[3]基于改进K-modes聚类的KNN分类算法[J]. 王志华,刘绍廷,罗齐.  计算机工程与设计. 2019(08)
[4]基于聚类的环形kNN算法[J]. 匡振曦,武继刚,李嘉兴.  计算机工程与科学. 2019(05)
[5]基于KNN算法的学生贷款风险模型[J]. 范睿智.  电子测试. 2019(Z1)
[6]K近邻分类指导的区域迭代图割算法研究[J]. 管建,王亚娟,王立功.  计算机应用与软件. 2018(11)
[7]结合文本信息量和聚类的文本裁剪算法[J]. 谢攀,邓珍荣,朱益立.  计算机工程与设计. 2018(03)
[8]基于模糊C-Means的改进型KNN分类算法[J]. 朱付保,谢利杰,汤萌萌,朱颢东.  华中师范大学学报(自然科学版). 2017(06)
[9]K最近邻算法理论与应用综述[J]. 毋雪雁,王水花,张煜东.  计算机工程与应用. 2017(21)
[10]一种基于样本有效性和KNN分类标记的采样传播型抠图方法[J]. 陈晓,何发智,章生冬.  计算机辅助设计与图形学学报. 2016(12)

硕士论文
[1]基于优化分割与提取的西夏古籍文字识别研究[D]. 李小璐.宁夏大学 2019
[2]基于K近邻的分类算法研究[D]. 桑应宾.重庆大学 2009



本文编号:3257276

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3257276.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1a26d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com