当前位置:主页 > 科技论文 > 自动化论文 >

基于图学习的属性选择与谱聚类算法改进研究

发布时间:2021-03-26 00:54
  图方法因其可以计算和保持数据内在关系的特性相较于原始数据可以展现出更强的表达能力,所以被广泛应用到不同的领域中。尤其是在机器学习领域中,图的结构保持性质可以保证在学习过程中获取更多有效信息的情况下保持数据的原始结构不变。而在不同的图结构保持方法中,图的局部近邻关系保持方法已经在谱属性选择算法和谱聚类算法中得到应用。不过,先前图局部邻域关系保持方法的局部结构构造方式仅依赖欧式距离来衡量空间中样本相似关系,一旦数据中存在噪音或冗余则会影响建立后的图矩阵的质量从而进一步影响最终的机器学习模型学习效果。因此,本文将针对现有图学习存在的问题,利用两种不同的改进策略来分别提出两种能够建立更高质量图矩阵的方法并利用这两种新方法分别提出更加有效的基于图学习的机器学习算法。论文的主体部分为下述内容:(1)基于局部协方差和正则化的谱聚类算法(LCSC算法)。LCSC算法将结合图学习、局部协方差和数据正则化来提出一种高效的谱聚类学习模型。此算法通过引入样本的局部协方差矩阵来解决单一欧式距离度量可能带来的簇交叉问题,并使用正则化方法归一化样本的相似性量级从而达到提升聚类算法准确率的目的。具体地,LCSC首先在... 

【文章来源】:广西师范大学广西壮族自治区

【文章页数】:46 页

【学位级别】:硕士

【部分图文】:

基于图学习的属性选择与谱聚类算法改进研究


数据稀疏图

参数,数据集,算法


广西师范大学硕士学位论文26(a1)数据集Hill-Valley(b1)数据集Palmdata(c1)数据集Newsgroup(d1)数据集Isolet(e1)数据集Orl(f1)数据集Coil图4.1不同参数下所有算法的聚类准确率结果图4.1展示了所提出目标函数中参数对最终属性选择结果的影响。其中,参数用来调整拟合回归项2||||FYXWR和图学习项||||2FXWSXW之间的量级平衡;参数是用来控制投影矩阵系数的稀疏程度。从图中可以看出,算法DFS-SR在数据集Hill-Valley和Newsgroup上且当设定参数103=和=103时,方法均获得了最佳的聚类表现;而当在数据集Palmdata上时且当102=和=103获得最优的结果。这说明本章提出的算法DFS-SR对于参数是敏感的,通过调节参数可以获得更优秀的属性选择效果。图4.2展示出了算法DFS-SR在不同数据

目标函数,迭代次数,数据集,师范大学


不同迭代次数下目标函数值变化


本文编号:3100633

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3100633.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0110d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com