当前位置:主页 > 科技论文 > 软件论文 >

稀疏样本自表达的子空间聚类算法

发布时间:2018-05-23 14:34

  本文选题:子空间聚类 + 自表示 ; 参考:《广西师范大学》2016年硕士论文


【摘要】:实际应用中,子空间聚类方法可以从高维数据中寻找一个低维表示,用少量的数据就能去描述整个数据空间。这在很大程度上提升了高维数据处理的效率。目前已存在不同形式的子空间聚类方法有不同的适用环境。其中基于谱聚类的子空间聚类算法是应用较为普遍的一类处理高维数据的聚类方法。现有的基于谱聚类的子空间聚类算法通常围绕数据的局部或全局信息去构建数据的相似度矩阵,然后通过谱聚类对该相似度矩阵进行处理获得最后的聚类结果。这些算法主要的差异在于构建相似度矩阵的方法。一个好的相似度矩阵往往可以更好的体现数据子空间结构,而有利于处理高维数据中数据可能来自多个不同子空间的复杂情况。因此,本文给出了一种基于稀疏样本自表达模型的算法去构建相似度矩阵。该算法主要有以下几个创新点:1.该算法利用样本之间固有相关性找出一组与待测样本相关性强的样本去度量样本之间的相似度,以便更好的体现样本之间的相似关系。2.该算法首先通过l1-范数对自表达矩阵进行全局稀疏,使其更能体现出样本空间的低维子空间属性。然后进一步通过l2,1-范数对自表达系数矩阵进行行稀疏,使其对噪音和离群点更具鲁棒性。3.该算法提出了一种求解稀疏自表达模型的优化算法,该优化算法可以在处理高维数据时快速收敛到最优解,极大的减少了计算的复杂度,提高了子空间聚类的效率。
[Abstract]:In practical application, the subspace clustering method can find a low-dimensional representation from the high-dimensional data, and the whole data space can be described with a small amount of data. This greatly improves the efficiency of high dimensional data processing. There are different subspace clustering methods in different environments. The subspace clustering algorithm based on spectral clustering is a kind of clustering method which is widely used to deal with high dimensional data. The existing subspace clustering algorithms based on spectral clustering usually construct the similarity matrix around the local or global information of the data, and then process the similarity matrix by spectral clustering to obtain the final clustering results. The main difference of these algorithms is the method of constructing similarity matrix. A good similarity matrix can better reflect the structure of the data subspace, and it is helpful to deal with the complex situation that the data in the high-dimensional data may come from many different subspaces. Therefore, this paper presents an algorithm based on sparse sample self-representation model to construct similarity matrix. The algorithm has the following innovations: 1. The algorithm uses the inherent correlation between samples to find a group of samples with strong correlation to measure the similarity between samples, in order to better reflect the similarity between samples. The algorithm firstly sparse the self-representation matrix globally by using l _ 1-norm, so that it can reflect the low-dimensional subspace attributes of the sample space more effectively. Then the self-expression coefficient matrix is sparse by L _ 2N _ 1-norm to make it more robust to noise and outliers. This algorithm proposes an optimization algorithm for sparse self-representation model. The algorithm can quickly converge to the optimal solution when processing high-dimensional data, greatly reduces the computational complexity and improves the efficiency of subspace clustering.
【学位授予单位】:广西师范大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13

【相似文献】

相关期刊论文 前10条

1 柳盛;吉根林;;空间聚类技术研究综述[J];南京师范大学学报(工程技术版);2010年02期

2 马程;杨诗琴;;基于量子粒子群的带障碍约束的空间聚类[J];安庆师范学院学报(自然科学版);2010年03期

3 殷俊华;李光强;陈翼;邓敏;;基于概念格的空间聚类方法[J];计算机系统应用;2011年06期

4 李霞;徐树维;;子空间聚类改进算法研究综述[J];计算机仿真;2010年05期

5 陈铭;吉根林;;一种基于相似维的高维子空间聚类算法[J];南京师大学报(自然科学版);2010年04期

6 马程;陈杰;;障碍约束下的空间聚类算法分析[J];宜春学院学报;2012年12期

7 张思亮;李广霞;;子空间聚类在入侵检测中的应用[J];计算机安全;2013年12期

8 何彬彬;方涛;郭达志;;基于不确定性的空间聚类[J];计算机科学;2004年11期

9 杨杨;孙志伟;赵政;;一种处理障碍约束的基于密度的空间聚类算法[J];计算机应用;2007年07期

10 李光强;邓敏;程涛;朱建军;;一种基于双重距离的空间聚类方法[J];测绘学报;2008年04期

相关会议论文 前6条

1 刘启亮;邓敏;彭东亮;徐震;;基于场论的空间聚类有效性评价方法研究[A];2009`中国地理信息产业论坛暨第二届教育论坛就业洽谈会论文集[C];2009年

2 邓羽;;广义多维云模型在空间聚类中的应用[A];地理学与生态文明建设——中国地理学会2008年学术年会论文摘要集[C];2008年

3 邓敏;刘启亮;李光强;程涛;;一种基于场模型的空间聚类算法[A];现代测量技术与地理信息系统科技创新及产业发展研讨会论文集[C];2009年

4 徐玉峰;周丽华;肖清;;一种基于数据分布差异度的子空间聚类算法[A];第二十五届中国数据库学术会议论文集(一)[C];2008年

5 张燕萍;姜青山;;k-means型软子空间聚类算法[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年

6 任家东;周玮玮;何海涛;;高维数据流的自适应子空间聚类算法[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年

相关博士学位论文 前3条

1 孙丽萍;半监督空间聚类方法及其在城市公共设施区位规划中的应用研究[D];安徽师范大学;2015年

2 黄明;基于空间分区的空间聚类研究[D];武汉大学;2010年

3 王剑亭;面向量子密钥分发安全性分析的子空间聚类算法研究[D];中国科学技术大学;2015年

相关硕士学位论文 前10条

1 魏海洋;城市案件空间聚类技术研究[D];北京建筑大学;2015年

2 张洋;基于空间聚类的公路交通运力态势可视化方法研究[D];国防科学技术大学;2013年

3 欧阳佩佩;改进的稀疏子空间聚类算法研究[D];青岛大学;2015年

4 孙素敏;子空间聚类及其应用[D];西安建筑科技大学;2016年

5 许亚骏;子空间聚类算法研究及应用[D];江南大学;2016年

6 凌晓蔚;基于子空间聚类的多关系社交网络挖掘研究[D];电子科技大学;2016年

7 吴飞;面向序列数据的稀疏低秩子空间聚类方法研究[D];北京工业大学;2016年

8 邓振云;稀疏样本自表达的子空间聚类算法[D];广西师范大学;2016年

9 齐绪停;基于子空间聚类的文本相关性研究[D];山东师范大学;2016年

10 杨杨;基于约束的空间聚类的研究[D];天津大学;2007年



本文编号:1925183

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1925183.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户55a83***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com