在线社交网络社会影响传播与影响最大化问题研究
发布时间:2017-04-01 16:10
本文关键词:在线社交网络社会影响传播与影响最大化问题研究,,由笔耕文化传播整理发布。
【摘要】:随着社交网站、博客、微博等网络应用的流行,各种各样的在线社交网络产生了。在社交网络中,用户既是信息的接受者,也是信息的制造者和传播者。这就为社交网络中信息的高速传播创造了条件。现在,社交网络已经成为一个巨大的信息传播平台,使得信息可以在短时间内影响很多的人。为了充分发挥社交网络作为信息传播平台的效用,社交网络面临两个挑战,即社会影响传播模型和影响最大化。前者是对社会影响在社交网络中的传播过程建模,后者则给出了在大规模社交网络中有效寻找最具影响力的节点的方法。本文以在线社交网络的应用为背景,针对社交网络传播模型和影响最大化开展的研究工作。首先,对社交网络的社区发现问题进行研究,基于社交网络中信息传播的局部性,提出了一种基于信息传播的社区发现算法DC_ID。该算法分为局部社区发现与局部社区合并两个阶段。在局部社区发现过程中,首先估算网络中各个节点的影响力,然后选取影响力较大的节点作为局部社区的核心,按照传播路径,逐层扩展,从而发现以其为核心的局部社区。在局部社区合并阶段,本文用组合熵估计两个局部社区的亲密度。当两个局部社区的组合熵高于某个提前设定的合并阈值时,该算法将两个社区合并在一起,从而发现整个网络的社区结构。其次,对于社交网络影响最大化算法效率较低的问题,基于社交网络的社区结构,提出了一种影响最大化算法CGINA。把社交网络中的信息传播看作各个社区之间的合作博弈,根据各个社区在信息传播博弈中的Shapley值,确定各个社区待发现的种子节点数。然后,在各个社区中挖掘指定数目的种子节点。再次,对基于节点信息偏好的影响最大化问题进行研究,基于网络中的节点对于不同主题信息的不同偏好,提出了一种基于信息主题偏好的2阶段影响节点挖掘算法L_GAUP。第一阶段,基于用户对于特定主题的偏好值,便可以得到对于待传播信息主题的易感染节点网络;与其他节点相比,易感染节点网络中的节点具有更高的偏好值。第二阶段,本算法利用贪心策略在易感染节点网络中挖掘影响节点。然后,考虑到负面影响在网络中传播的情况,将负面影响传播集成到经典的线性阈值模型中,提出一种集成负面影响传播的线性阈值模型的扩展模型LTN,并对该模型下影响函数的单调性和子模性给出相应证明。基于这些性质,提出了一种近似因子为1-1/e的贪心算法和三种改进的算法LTN_New Greedy、LTN_CELF和LTN_Mixed Greedy。最后,基于竞争性的信息传播模型COICM(Campaign-Oblivious Independent Cascade Model,COICM),研究了该模型下的影响抑制最大化问题。为提高算法的效率,基于信息传播的局部性,提出了一种基于社区结构的CB_IBM算法。
【关键词】:在线社交网络 影响传播模型 影响最大化 社区发现 信息偏好 负面影响传播 竞争性社会影响
【学位授予单位】:燕山大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TP393.092;G206
【目录】:
- 摘要5-7
- ABSTRACT7-12
- 第1章 绪论12-26
- 1.1 研究的目的和意义12-14
- 1.2 国内外研究现状及分析14-22
- 1.2.1 社区发现算法现状分析14-17
- 1.2.2 社会影响传播模型现状分析17-18
- 1.2.3 影响最大化问题现状分析18-22
- 1.3 本论文研究内容22-24
- 1.3.1 影响最大化算法的改进策略研究22-23
- 1.3.2 基于社会影响主题偏好的影响最大化问题研究23
- 1.3.3 基于竞争环境的影响抑制最大化问题研究23-24
- 1.4 论文结构24-26
- 第2章 基于信息传播的社区发现问题研究26-48
- 2.1 引言26-28
- 2.2 相关概念28-29
- 2.3 基于信息传播的社区发现算法设计29-40
- 2.3.1 局部社区发现30-36
- 2.3.2 局部社区合并36-38
- 2.3.3 DC_ID算法的实现38-39
- 2.3.4 复杂性分析39-40
- 2.4 实例分析40-42
- 2.5 实验与仿真分析42-46
- 2.5.1 数据集42-43
- 2.5.2 评价指标43-44
- 2.5.3 实验效果及分析44-46
- 2.6 本章小结46-48
- 第3章 基于社区结构的影响最大化问题研究48-59
- 3.1 引言48
- 3.2 协作博弈和SHAPLEY值48-49
- 3.3 基于社区结构的影响最大化算法49-53
- 3.3.1 信息传播合作博弈50-51
- 3.3.2 每个社区待挖掘关键节点数的确定51
- 3.3.3 桥节点的发现51
- 3.3.4 影响节点的发现51-53
- 3.3.5 CGINA算法的时间复杂度分析53
- 3.4 实验53-57
- 3.4.1 实验环境53-54
- 3.4.2 实验结果54-57
- 3.5 本章小结57-59
- 第4章 基于信息偏好的影响最大化问题研究59-75
- 4.1 引言59-60
- 4.2 E_IC模型及其影响最大化问题60-62
- 4.2.1 E_IC模型60-61
- 4.2.2 E_IC模型的性质61-62
- 4.2.3 基于E_IC模型的影响最大化问题62
- 4.3 算法设计62-68
- 4.3.1 用户偏好的计算62-64
- 4.3.2 基于用户信息偏好的影响最大化算法L_GAUP64-68
- 4.4 实验分析68-73
- 4.4.1 实验环境69-70
- 4.4.2 易感染阈值l对L_GAUP算法的影响70-71
- 4.4.3 L_GAUP与GAUP和CELF的比较71-73
- 4.5 本章小结73-75
- 第5章 集成负面影响传播的影响最大化问题研究75-94
- 5.1 引言75
- 5.2 相关文献75-76
- 5.2.1 影响传播模型75-76
- 5.2.2 影响最大化问题76
- 5.3 LTN模型及其性质76-79
- 5.3.1 LTN模型76-78
- 5.3.2 LTN模型的性质78-79
- 5.4 基于LTN模型的影响最大化算法79-89
- 5.4.1 KK_Greedy算法80-81
- 5.4.2 KK_Greedy算法的改进81-89
- 5.5 实验89-93
- 5.5.1 数据集90
- 5.5.2 实验结果90-93
- 5.6 本章小结93-94
- 第6章 基于竞争环境的影响抑制最大化问题研究94-123
- 6.1 引言94-95
- 6.2 相关工作95-102
- 6.2.1 影响最大化问题95-97
- 6.2.2 影响传播模型97-102
- 6.3 影响抑制最大化问题102-104
- 6.3.1 问题定义102-103
- 6.3.2 IBM问题的相关性质103-104
- 6.4 算法设计104-115
- 6.4.1 基于贪心策略的IBM算法104-106
- 6.4.2 基于社区结构的IBM算法CB_IBM106-115
- 6.5 实验115-121
- 6.5.1 实验环境115-116
- 6.5.2 带有Greedy算法的实验结果116-119
- 6.5.3 不包含Greedy算法的实验结果119-120
- 6.5.4 影响阈值η 对算法CB_IBM的作用120-121
- 6.6 本章小结121-123
- 结论123-125
- 参考文献125-133
- 攻读博士学位期间承担的科研任务与主要成果133-135
- 致谢135-136
- 作者简介136
【参考文献】
中国期刊全文数据库 前1条
1 何东晓;周栩;王佐;周春光;王U
本文编号:280911
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/280911.html