基于谱聚类的域间社区挖掘算法研究
本文关键词:基于谱聚类的域间社区挖掘算法研究
【摘要】:互联网高端技术的创新与发展,给人类社会带来了巨大的变化,人类社会已经进入一个信息化的时代。人们获取信息的方式日新月异,使得信息的数量飞速递增,且描述同一事物信息展现出多领域的特性。这些各式各样的社会网络承载着人们在生活和生产中形成的复杂关系,如何从这些杂乱无章的社会网络中发现潜在价值关系,这一点越来越受到人们的关注。随着Web 2.0技术的发展,互联网正朝着社区化的方向发展,用户希望通过参与,互动,来获得更多感兴趣的社区信息。在社会网络中的用户之间存在一些潜在的结构关系,一般用图结构表示,图中节点表示网络中的个体,边表示个体之间的某种关系(诸如参与相同活动的关系)。一般而言,同一社区内部链接稠密,而不同社区之间链接稀疏。从本质上讲,社区挖掘就是从连通图中识别出在某种性质达到局部最优的稠密子图。传统的社区发现方法主要面对单一领域,由于考虑的因素单一,无法通过其他领域的有效信息来提高当前领域的聚类准确性,本文提出了一种基于谱聚类思想的迭代式社区发现算法,以K均值算法为基础,以谱聚类算法思想为解决方案,该算法通过其他领域对本领域的相似矩阵不断进行修正,从而实现领域之间的互相促进。根据结果分析出算法的不足,通过相似度修正以及迭代的终止条件对算法进行了优化,并且对优化的结果与之前的结果进行比较,可以直观的看出优化的效果。在迭代式域间社区挖掘的前提下,对不同领域的结果进行聚类融合,聚类融合方案以标签合并与投票相结合的方法,有效的对多个领域的聚类结果进行融合,该算法可以适应各领域实体不全部相同的情况,并且通过实验验证了聚类结果的有效性。
【关键词】:域间社区挖掘 协同聚类 融合
【学位授予单位】:大连海事大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13
【目录】:
- 摘要5-6
- ABSTRACT6-10
- 第1章 绪论10-15
- 1.1 研究背景与意义10-11
- 1.2 国内外研究现状11-12
- 1.3 论文的主要工作12-13
- 1.4 论文的组织结构13-14
- 1.5 本章小结14-15
- 第2章 社区挖掘概述15-25
- 2.1 社区结构概述15
- 2.2 社区挖掘概述15-16
- 2.3 社区挖掘经典方法16-21
- 2.3.1 基于划分的社区挖掘方法17-18
- 2.3.2 基于层次的社区挖掘方法18-19
- 2.3.3 基于密度的社区挖掘方法19-20
- 2.3.4 基于网格的社区挖掘方法20-21
- 2.4 社区挖掘算法性能分析参数21-22
- 2.5 社区挖掘算法国际评判标准22-24
- 2.5.1 类内凝聚度和类间分离度与人工评判22-23
- 2.5.2 互信息和规范化互信息23-24
- 2.6 本章小结24-25
- 第3章 谱聚类算法研究25-37
- 3.1 谱聚类算法介绍25
- 3.2 谱图理论25-29
- 3.2.1 图的基本概念25-26
- 3.2.2 构造相似度图26
- 3.2.3 图的Laplacian及其基本性质26-28
- 3.2.4 谱图理论的学习算法28-29
- 3.3 图划分准则29-32
- 3.3.1 最小割集准则29-30
- 3.3.2 规范割集准则30
- 3.3.3 比例割集准则30
- 3.3.4 平均割集准则30-31
- 3.3.5 最小最大割集准则31
- 3.3.6 多路割集准则31-32
- 3.4 谱聚类相似矩阵32-33
- 3.4.1 径向基核函数32-33
- 3.5 谱聚类算法33-36
- 3.5.1 迭代谱聚类算法34-35
- 3.5.2 多路谱聚类算法35-36
- 3.6 本章小结36-37
- 第4章 基于谱聚类的域间社区挖掘模型设计37-48
- 4.1 谱聚类算法选择37-40
- 4.1.1 NCut算法37-39
- 4.1.2 相似矩阵构造方法39
- 4.1.3 领域半径r39-40
- 4.1.4 尺度参数σ40
- 4.2 域间社区发现模型40-46
- 4.2.1 问题提出41-44
- 4.2.2 域间社区发现模型定义44-46
- 4.3 本章小结46-48
- 第5章 域间社区挖掘算法48-66
- 5.1 域间社区挖掘算法问题解决方案48-51
- 5.1.1 算法基本思路49
- 5.1.2 相似矩阵构建49-50
- 5.1.3 算法描述50-51
- 5.2 算法存在问题与优化策略51-53
- 5.2.1 算法优化策略51-53
- 5.2.2 改进算法流程53
- 5.3 聚类融合53-58
- 5.3.1 聚类融合算法综述54-56
- 5.3.2 社区匹配策略56-57
- 5.3.3 域间融合算法57-58
- 5.4 实验结果分析58-65
- 5.4.1 实验环境59-60
- 5.4.2 径向基核函数聚类结果评测60-62
- 5.4.3 算法优化后聚类结果评测62-64
- 5.4.4 聚类融合结果评测比较64-65
- 5.5 本章小结65-66
- 第6章 总结与展望66-68
- 6.1 总结66-67
- 6.2 展望67-68
- 参考文献68-72
- 致谢72
【相似文献】
中国期刊全文数据库 前10条
1 王娜;杜海峰;庄健;余进涛;王孙安;;三种典型的基于图分割的谱聚类方法比较[J];系统仿真学报;2009年11期
2 王会青;陈俊杰;;基于图划分的谱聚类方法的研究[J];计算机工程与设计;2011年01期
3 王春腾;符传谊;邢洁清;;基于非负约束的谱聚类方法[J];电脑知识与技术;2011年17期
4 何飞;王晓晨;马粹;梁治国;;生产状态的测地距离谱聚类分析[J];计算机工程与应用;2012年24期
5 薛宁静;;生产状态的熵值评估谱聚类分析[J];计算机工程与应用;2012年19期
6 管涛;王杰;;谱聚类的算子理论研究进展[J];计算机科学;2013年S1期
7 周文刚;陈雷霆;董仕;;基于谱聚类的网络流量分类识别算法[J];电子测量与仪器学报;2013年12期
8 王玲;薄列峰;焦李成;;密度敏感的半监督谱聚类[J];软件学报;2007年10期
9 林立;胡侠;朱俊彦;;基于谱聚类的多文档摘要新方法[J];计算机工程;2010年22期
10 刘馨月;李静伟;于红;尤全增;林鸿飞;;基于共享近邻的自适应谱聚类[J];小型微型计算机系统;2011年09期
中国博士学位论文全文数据库 前1条
1 孔敏;关联图的谱分析及谱聚类方法研究[D];安徽大学;2006年
中国硕士学位论文全文数据库 前10条
1 陈昭彤;基于拓扑势和谱聚类的社区发现研究[D];中国矿业大学;2015年
2 张吉文;基于谱聚类的文本聚类算法研究[D];贵州大学;2015年
3 李伟龙;基于面向对象SVM和谱聚类的极化SAR分类[D];西安电子科技大学;2014年
4 崔竹冬;基于谱聚类的三维血管点云分割技术研究[D];哈尔滨工业大学;2016年
5 崔海玉;基于谱聚类的域间社区挖掘算法研究[D];大连海事大学;2016年
6 何心琪;基于谱聚类的水声图像分割技术研究[D];哈尔滨工程大学;2013年
7 赵冬琴;基于谱聚类的MCI影像学分类特征研究与应用[D];太原理工大学;2014年
8 张俊英;基于谱聚类的图书目录重构[D];浙江大学;2010年
9 张天强;基于谱聚类的亲友通话圈挖掘[D];华南理工大学;2013年
10 郑伟;基于核与特征选择的谱聚类社区检测算法[D];西安电子科技大学;2013年
,本文编号:953923
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/953923.html