在线社交网络中的影响力分析及应用研究
发布时间:2020-07-16 05:05
【摘要】:随着移动互联网以及移动终端的飞速发展,类型各异的在线社交网络迅速普及。社交网络的出现,极大的丰富了用户的社交需求。不同于传统的信息媒体,在社交网络中,人们不仅是信息的浏览者,而且可以发布以及传播信息。在互联网时代,在线社交网络已然成为人们获取信息、传播信息以及沟通感情的重要媒介。随着在线社交网络的广泛普及,社交用户的规模呈爆炸式增长,并且产生了丰富的社交活动数据,这些数据蕴含着重要的信息,对这类数据的深入研究可以很好地挖掘用户的社交影响力,进而推动信息传播、网络营销、社区发现、行为预测、社交推荐以及社交广告等社交应用的研究,这些应用无疑会对社交网络平台以及社交用户产生巨大的帮助。由于社交影响力具有巨大的商业价值以及应用价值,在线社交网络中的用户影响力及应用研究受到了学术界和应用界的广泛关注。类型各异的在线社交网站以及多样化的社交数据给在线社交网络中的影响力分析及应用研究带来发展机遇的同时也带来了严峻的挑战。虽然国内外的研究人员在该领域取得了一系列的研究成果,然而现有的成果在社交影响力度量的准确性以及社交网络数据挖掘的深度性等方面仍有不足。因此,本文针对在线社交网络中的多样化应用需求以及现有成果的不足,利用社交网络的拓扑结构以及用户在社交网络中的行为信息,深入研究了在线社交网络中用户影响力的度量以及基于用户影响力的重要社交应用(即病毒营销与社区发现),取得了以下研究成果:(1)针对社交网络中的用户影响力度量问题,根据基于活动的社交网络的独有特性,提出了一种基于协同过滤的用户影响力度量方法。为了研究基于活动的社交网络中用户更为细粒度的影响力,将用户在活动层面的影响力定义为用户在每个活动上能够影响的好友比例,并且根据用户在过去所参与的活动信息,构造了用户-活动影响力矩阵。针对用户-活动影响力矩阵中的未知元素预测问题,提出了一种混合协同过滤模型,该模型同时将活动近邻方法以及用户近邻方法融入到了矩阵分解方法中。为了进一步提高预测的准确度,利用基于活动的社交网络中的多元属性,即活动的文本内容,活动的地理位置以及活动的组织者,提出了活动近邻发现方法以及用户近邻发现方法。最后,利用真实的基于活动的社交网络数据集,即豆瓣同城数据集,开展了实验验证,实验结果表明,所提的混合协同过滤模型可以准确的度量用户在活动层面的社交影响力。(2)针对社交网络中的病毒营销问题,融合用户的主题偏好以及地理位置偏好,提出了一种位置感知的定向影响力最大化方法。针对一个包含主题信息以及地理位置信息的在线查询,基于R树,设计了融合主题信息的TR树索引结构,以快速找到查询的目标用户以及计算用户对查询的偏好值。根据位置感知的特定查询,基于获取的用户偏好,定义了融入用户偏好的种子集合影响范围函数。为了找到种子用户集合,设计了高效的近似求解算法。其中,通过利用线下构造的用户影响力索引结构以及快速的线上影响力估计方法,近似算法能够高效且准确的找到种子用户集合。为了进一步提高查询的效率,基于对用户影响力的快速估算,设计了快速的启发式求解算法。最后,基于真实的社交网络数据集开展了实验验证。实验结果表明,针对位置感知的在线查询,所提的近似算法和启发式算法不仅能够得到高精度的查询结果,而且具有很高的查询效率。(3)针对社交网络中的社区发现问题,考虑基于活动的社交网络中的异构信息,提出了一种基于用户影响力的社区发现方法。首先,根据线上的社交关系网络以及线下的用户参与活动网络,提出了融合网络拓扑结构以及用户行为信息的社交影响力度量方法。在该方法中,利用线上网络中相邻用户间的共同邻居信息,度量了基于网络拓扑结构的社交影响力;利用用户的历史行为信息以及社交活动的多元属性,计算用户在三个方面的偏好(即活动主题、活动区域以及活动组织者)的相似度,度量了基于用户行为的社交影响力。其次,基于度量的社交影响力,设计了融入近邻约束的深度自编码器以获取用户社区导向的潜在多维表达。再次,利用用户的潜在表达,基于k-means聚类算法,挖掘基于活动的社交网络中的社区结构。最后,基于真实的社交网络数据集开展了实验分析,实验结果表明,所提的社区发现算法能够有效地发现基于活动的社交网络中紧密的社区结构。
【学位授予单位】:北京邮电大学
【学位级别】:博士
【学位授予年份】:2019
【分类号】:TP393.09
【图文】:
处于非激活态。在每一次迭代中,激活态的节点以激活态的邻居节点,并且,每个节点累加其邻居节点活态的节点累加所有邻居节点的影响力(即所有处之和)大于其自身的阈值时,该节点被激活,并且其邻居节点;否则,该节点仍然处于非激活态。重新的节点被激活。与独立级联模型相同,该模型也响概率/?(/,_/)是已知的。逡逑染病模型逡逑染病模型SIR是由William邋Kermack等人提出的动络中的节点可能处于S、八i?三种状态。其中S),也就是节点目前处于健康状态,但是有可能被其(Infected),也就是节点目前处于患病状态,其有除状态(Recovered),也就是患病后被治愈的状态,,不可能被再次感染。网络中节点状态间的转化顺序
a)生成文档-主题概率分布&?且0;—般也是稀疏b)生成单词个数其中,尸0/观3/2(()是参泊松分布;逡逑c)对文档m中的每个单词《邋e邋[1,2,...,,逡逑i生成主题分布 ̄邋Mw/?),其中,)为参多项式分布;逡逑ii邋生成单词邋w,?邋?邋 ̄逦J。逡逑图2-3是LDA的图模型表示。基于以上生成过程,可以得到整个布:逡逑Nm逡逑{^ZmAn^\(X^)邋=邋Y{p{Wm,n\(P,m)p{Zm,n\ei,)p{em\a)p(^\P)-7=1逡逑LDA最初的参数推断方式为变分推断(Variational邋Inference)邋[84],采用更为简单的吉布斯采样(Gibbs邋Sampling)对参数进行推断。逡逑
图3-1基于活动的社交网络的表示逡逑3.2.问题描述以及模型框架逡逑图3-1表示一个基于活动的社交网络。在该社交网络中,用户和活动是两个逡逑重要的组成部分,用户是社交活动的参与者,他们之间通过线上的社交关系组成逡逑一个线上社交网络。每个社交活动具有多种信息,包括文本内容、地理位置以及逡逑活动组织者等。其中,文本内容信息描述了活动的主题以及具体内容,地理位置逡逑信息描述了活动的具体举办地点,通常用经炜度表示,组织者信息描述了活动的逡逑举办者。值得注意的是,不同的社交活动可能在同一个地理位置举办,同一个组逡逑织者也可能组织过多个社交活动。在基于活动的社交网络中,用户可以主动搜索逡逑活动,也可以看到好友分享的活动,同时在每个社交活动页面,用户可以看到线逡逑上报名参加该活动的所有参与者。在看到感兴趣的活动后
【学位授予单位】:北京邮电大学
【学位级别】:博士
【学位授予年份】:2019
【分类号】:TP393.09
【图文】:
处于非激活态。在每一次迭代中,激活态的节点以激活态的邻居节点,并且,每个节点累加其邻居节点活态的节点累加所有邻居节点的影响力(即所有处之和)大于其自身的阈值时,该节点被激活,并且其邻居节点;否则,该节点仍然处于非激活态。重新的节点被激活。与独立级联模型相同,该模型也响概率/?(/,_/)是已知的。逡逑染病模型逡逑染病模型SIR是由William邋Kermack等人提出的动络中的节点可能处于S、八i?三种状态。其中S),也就是节点目前处于健康状态,但是有可能被其(Infected),也就是节点目前处于患病状态,其有除状态(Recovered),也就是患病后被治愈的状态,,不可能被再次感染。网络中节点状态间的转化顺序
a)生成文档-主题概率分布&?且0;—般也是稀疏b)生成单词个数其中,尸0/观3/2(()是参泊松分布;逡逑c)对文档m中的每个单词《邋e邋[1,2,...,,逡逑i生成主题分布 ̄邋Mw/?),其中,)为参多项式分布;逡逑ii邋生成单词邋w,?邋?邋 ̄逦J。逡逑图2-3是LDA的图模型表示。基于以上生成过程,可以得到整个布:逡逑Nm逡逑{^ZmAn^\(X^)邋=邋Y{p{Wm,n\(P,m)p{Zm,n\ei,)p{em\a)p(^\P)-7=1逡逑LDA最初的参数推断方式为变分推断(Variational邋Inference)邋[84],采用更为简单的吉布斯采样(Gibbs邋Sampling)对参数进行推断。逡逑
图3-1基于活动的社交网络的表示逡逑3.2.问题描述以及模型框架逡逑图3-1表示一个基于活动的社交网络。在该社交网络中,用户和活动是两个逡逑重要的组成部分,用户是社交活动的参与者,他们之间通过线上的社交关系组成逡逑一个线上社交网络。每个社交活动具有多种信息,包括文本内容、地理位置以及逡逑活动组织者等。其中,文本内容信息描述了活动的主题以及具体内容,地理位置逡逑信息描述了活动的具体举办地点,通常用经炜度表示,组织者信息描述了活动的逡逑举办者。值得注意的是,不同的社交活动可能在同一个地理位置举办,同一个组逡逑织者也可能组织过多个社交活动。在基于活动的社交网络中,用户可以主动搜索逡逑活动,也可以看到好友分享的活动,同时在每个社交活动页面,用户可以看到线逡逑上报名参加该活动的所有参与者。在看到感兴趣的活动后
【相似文献】
相关期刊论文 前10条
1 王超琼;陈s
本文编号:2757560
本文链接:https://www.wllwen.com/guanlilunwen/yingxiaoguanlilunwen/2757560.html