基于重叠用户的跨社交网络社区发现
发布时间:2020-08-26 17:49
【摘要】:社区发现是社交网络相关研究的重要组成部分,社区反映了社交网络中用户间的关联关系,具有巨大的数据挖掘价值。同时,随着用户需求的日益多样化,不同类型的社交网络得到蓬勃发展。跨社交网络间存在着广泛的数据流动和信息互补等现象,该场景下的相关研究具有较高的学术价值。跨社交网络下的应用研究同样需要社区发现工作的支持,例如跨社交网络下的舆情分析、信息检索、内容推荐等。但是,不同社交网络间显式关联关系较少,网络主体功能差别明显。因此,如何实现跨社交网络的社区发现成为当下研究工作的新挑战。本文将不同社交网络中同时具有活跃账户的互联网用户定义为跨社交网络重叠用户。重叠用户在不同社交网络中广泛存在,且多数重叠用户会在不同网络中发布相似信息,搭建了不同社交网络间信息流动的“桥梁”。因此,针对上面的问题,本文以跨社交网络重叠用户为基础,提出基于重叠用户的跨社交网络社区发现方案。本文首先从不同社交网络中挖掘跨社交网络重叠用户集合,并进行筛选。然后对重叠用户集合建模,构建跨社交网络重叠用户混合网络。之后使用本文提出的CMN_NMF多维网络子团划分算法对重叠用户混合网络进行社区划分,获得关联关系紧密的重叠用户子团。以重叠用户子团为核心在不同社交网络中进行基于重叠用户子团的社区发现工作,获得每个社交网络的社区划分。最后将不同社交网络中拥有相同重叠用户子团的社区进行融合,获得跨社交网络社区。本文以知乎和微博社交网络中的用户群体作为真实数据集来验证本研究提出方法的有效性。在实验中提出重叠用户子团文本内容相似度,跨社交网络社区内文本内容相似度和隐式重叠用户发现比例三个评价指标来进行不同算法的对比。对比实验结果表明,本研究给出的跨社交网络社区发现方案能够更好的挖掘不同社交网络中的相似用户,满足现实研究需要。最后,本文设计并实现了跨社交网络社区展示的原型系统,以web页面的形式对社区用户关联关系和用户详细信息进行了可视化展示。
【学位授予单位】:东南大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP393.09
【图文】:
图 2.1 拉格朗日乘子法等高线示例图),首先给出其在二维平面上的等高线,如) ,如上图绿色曲线所示。目标函数 ( 、相离这三种情况。约束条件曲线和等高约束条件曲线和等高线相交或者相切时,数的最优解,因为相交意味着肯定还有其等高线和约束条件曲线的交点使得目标函件曲线相切时,才能得到满足要求的最优必要条件是目标函数和约束条件函数相切示: ( ) ( ) ,与优化问题中给出的约束 ( )
里的条件便是 KKT 条件。公式化表示如下:) ≤ (原始不等式约束)) (原始等式约束) (非负性) ) (互补松弛性) ) 格朗日函数后,通过使用 KKT 条件可以解决不等式约束优化问阵分解算法相关理论知识分解算法最早由 Lee 和 Seung 两人[27]在 1999 年的 Nature 杂志上想是对给定的非负矩阵 要求将其分解为非负矩阵 和非负矩阵乘积尽可能等于原矩阵 。如图 2.2 所示:
东南大学硕士学位论文制条件被引入后,大大增加了矩阵分解算法的现实应用场景,使得分具有了可解释性。分解后的基矩阵 可以理解为降维后的特征矩阵,阵 的低维表示,反映了“局部构成整体”的概念。该算法已经在图像荐系统、语音处理、生物医药工程等多个重要研究领域取得广泛应矩阵分解应用最为成功的图像分析和处理领域为例,解释该算法在实。一个 2000 张人脸图片的集合,每张图片由 × 的像素点阵表示可以用一个 × 的非负矩阵进行表示。设定抽取的面部特征个阵分解算法处理该矩阵,可以得到 × 的面部特征基矩阵 和权图 2.3 所示:
【学位授予单位】:东南大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP393.09
【图文】:
图 2.1 拉格朗日乘子法等高线示例图),首先给出其在二维平面上的等高线,如) ,如上图绿色曲线所示。目标函数 ( 、相离这三种情况。约束条件曲线和等高约束条件曲线和等高线相交或者相切时,数的最优解,因为相交意味着肯定还有其等高线和约束条件曲线的交点使得目标函件曲线相切时,才能得到满足要求的最优必要条件是目标函数和约束条件函数相切示: ( ) ( ) ,与优化问题中给出的约束 ( )
里的条件便是 KKT 条件。公式化表示如下:) ≤ (原始不等式约束)) (原始等式约束) (非负性) ) (互补松弛性) ) 格朗日函数后,通过使用 KKT 条件可以解决不等式约束优化问阵分解算法相关理论知识分解算法最早由 Lee 和 Seung 两人[27]在 1999 年的 Nature 杂志上想是对给定的非负矩阵 要求将其分解为非负矩阵 和非负矩阵乘积尽可能等于原矩阵 。如图 2.2 所示:
东南大学硕士学位论文制条件被引入后,大大增加了矩阵分解算法的现实应用场景,使得分具有了可解释性。分解后的基矩阵 可以理解为降维后的特征矩阵,阵 的低维表示,反映了“局部构成整体”的概念。该算法已经在图像荐系统、语音处理、生物医药工程等多个重要研究领域取得广泛应矩阵分解应用最为成功的图像分析和处理领域为例,解释该算法在实。一个 2000 张人脸图片的集合,每张图片由 × 的像素点阵表示可以用一个 × 的非负矩阵进行表示。设定抽取的面部特征个阵分解算法处理该矩阵,可以得到 × 的面部特征基矩阵 和权图 2.3 所示:
【相似文献】
相关期刊论文 前10条
1 陈健;周丽华;;大学生社交网络自我表露的实证研究[J];高校辅导员学刊;2018年06期
2 谭洪旭;袁帅;代连奇;任利峰;;浅谈社交网络对当代大学生的影响[J];产业与科技论坛;2018年24期
3 孙夏卿;;社交网络媒体对大学生赋权的价值体现[J];传播力研究;2018年31期
4 张晓飞;;以社交网络为基础的企业营销策略[J];商场现代化;2018年22期
5 孙国强;窦倩倩;张宝建;;西方社交网络研究进展与未来展望[J];情报科学;2019年02期
6 陈文泰;李卫东;;国际社交网络中“国家实在”传播与国家形象演化机制研究[J];新闻大学;2018年06期
7 孙金铭;吴s我
本文编号:2805499
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2805499.html