基于亲密度及影响力的微博社交兴趣圈挖掘算法研究
发布时间:2024-04-01 01:36
社交网络是近几年来迅速崛起的一类新型Web服务,它们以用户之间的在线朋友关系为基础,使得人们可以在朋友间自由的分享兴趣和活动。Twitter和新浪微博是第二代社交网络,即微博服务的代表。随着移动互联网的发展,微博已经成为了最为流行的信息传播平台,拥有巨大的影响力和海量用户社交数据。 社会网络的分析和挖掘目前已经成为了研究的热门领域,社区发现作为社会网络分析中的重要方面,也获得了极大的关注。现有的社区发现方法大多面向全局网络,以某节点为中心的局部网络社区发现算法比较缺乏;现有方法主要考虑网络的连接结构,忽略了亲密度、影响力和用户交互行为等社交因素;现有方法大部分是单分类算法,能够发掘重叠社区的多分类算法尚不完善。 论文基于以上问题,提出了基于用户亲密度及影响力的微博社交兴趣圈挖掘算法。所提算法基于微博用户个人交互数据,采用了逐步扩充的策略,同时考虑到了网络连接结构、用户亲密度和影响力三方面因素,主要工作如下: 1、在中心用户的一级交互图中,利用图论中k团社区的理论,寻找能够形成用户多个社交兴趣圈的种子集合。此工作主要考虑网络连接结构,生成高质量的社交兴趣圈核心,同时初步确定用户社交兴趣圈...
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
本文编号:3944806
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
图1-1微博社交兴趣圈算法挖掘目标
用户的多样性,用户拥有的社交兴趣圈类型和为,在社区数量未知的情况下,挖掘多个高度o-centric)社区。挖掘目标如图1-1所示。
图2-1有向社会关系图
动者之间的由特定关系而发生互动,进而积累起来的联系模式。在社会网络分析中,通常使用图论进行研究,即将社会网络抽象为社会关系图和社会关系矩阵,如图2-1和图2-2所示。图2-1有向社会关系图
图3-7KCC算法种子挖掘结果
图3-7KCC算法种子挖掘结果将KCC算法和GCE算法的结果对比即可看出,作者一共有3个社交圈种子,种子1直接包含了所有的中学同学,完全避免了冰山孤岛现象;种子2则是数据挖掘和社会网络分析领域的一些专家,反映出了作者在科研方面的兴趣;种子3成员包括了两个工业界的人....
图3-8亲密度分析结果
本文编号:3944806
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3944806.html