社会网络信息传播与影响力最大化研究
本文关键词: 社会网络 信息传播 影响力最大化 出处:《南京大学》2016年博士论文 论文类型:学位论文
【摘要】:随着互联网的普及和在线社会网络的发展,研究者可以获取丰富的历史数据,并对社会网络中的信息传播进行分析、预测和利用。作为一种新型的媒介,社会网络中的信息可以像“病毒”一样迅速地在人与人之间传播,因此受到了普遍的关注:一方面,相比于电台、报纸、电视等大众传媒广播的方式,社会网络中的信息传播具有“口口相传”的效应,更容易被人们所信任;另一方面,信息的传播还可能具有级联效应,造成广泛的影响。然而,社会网络中难以预测的个体行为和复杂的拓扑结构,为信息传播的分析和利用带来了极大的挑战。因此,如何通过历史数据挖掘,对信息传播进行分析预测,并进一步利用信息传播达到影响力最大化,为企业宣传、广告营销、舆情监控等提供决策辅助,已成为当前社会网络研究的一个热点问题。针对上述问题,本文首先对信息级联的结构进行挖掘,识别出社会网络信息级联几种典型结构模式,并利用结构模式对信息传播进行预测;然后基于信息传播的模式,分析了多种信息同时传播的交互模型,用信息回溯的方法找到最有影响力的节点;最后研究了在给定预算的情况下,如何通过预算分配来激励这些最有影响力的节点,从而使得影响力的扩散可以达到最大。论文的主要贡献可概括如下:(1)分析信息传播的级联结构,并通过级联结构预测信息未来的传播模式。在社会网络中,信息级联的结构往往和信息传播互相影响。首先,不同机制所驱动的信息传播会导致结构不同的级联,同质性主导的级联往往会发展为宽而浅的结构,而社会影响力主导的级联则会变得深而复杂;其次,不同结构的信息级联会传播到不同的范围和社群,从而影响信息的传播过程。本文采用数据驱动的方法,分析了大量信息级联的传播结构,通过对信息级联的结构进行降维嵌入(embedding)和谱聚类(spectral clustering),识别出社会网络中的信息级联五种典型的结构模式,并且发现不同结构模式的信息级联之间具有明显差异的特征。根据以上观察,本文引入级联结构来预测信息未来的传播模式,实验结果表明,该方法可以显著提升预测的准确率。(2)研究了多种信息同时传播的交互模型,并识别其中有影响力的节点。社会网络中往往有多种信息在同时传播,而且信息之间可能存在竞争、互利等交互关系。针对这种情况,本文设计了交互信息级联模型来刻画多种信息之间的传播,可以同时考虑信息之间的交互关系和用户对交互信息的选择偏好。在这个模型下,本文首先证明了该问题是NP难的,并提出了一种基于回溯的马尔科夫随机游走(markov random walk)算法:假设信息传播可以达到所有节点,然后通过传播模型进行回溯,找出信息最有可能的来源,即为影响力最大的节点。模拟实验表明,相比于其它常用的算法,本文提出的算法可以在绝大多数情况下取得最好的效果。同时,该算法还可以快速地收敛,因此有很高的运行效率。(3)提出了一个基于预算分配的策略,通过激励社会网络中的初始用户实现影响力最大化。为了激励初始用户实现影响力最大化,以往的工作一般理想地假设用户具有确定的估值,只有分配的预算高于该估值,用户才会成为初始用户;而在实际情况中,在不同的预算下,用户都有可能成为初始用户。本文使用效用函数(utility function)来刻画用户的满意度,假定用户的估值满足一定的概率分布函数。在这个模型下,通过归约证明了该问题的难度。同时,提出了一个离散贪心的算法来找出预算分配的方案:首先将预算均匀地离散化,然后采用迭代的方式将预算依次分配给具有边际增益最大的用户。该方法可以在离散的设置中取得近似最优的结果。进一步,本文还证明了当合理地选择一个离散的粒度后,该算法可以在预算连续的设置下取得1-1/e-o(1)的性能保证。最后,本文还通过更新边际增益的计算和估算传播概率的方法来提升算法的执行效率。实验结果表明,相比于其它已有的方法,离散贪心的算法能显著提高信息覆盖的范围,同时还有非常好的可扩展性。
[Abstract]:With the popularity of the Internet and online social networks, researchers can obtain rich historical data, and the dissemination of information in social network analysis, prediction and use. As a new media, social network information can be like a virus as fast speed in communication between people, so widespread attention: on the one hand, compared to newspapers, radio, television and other mass media broadcast mode, the dissemination of information in social networks with "word of mouth" effect, more likely to be discredited; on the other hand, the dissemination of information also may have a cascading effect, causing widespread influence. However, it is difficult to prediction of individual behavior in social network and complex topology, analysis and utilization of information dissemination has brought great challenges. Therefore, how to use historical data mining, the dissemination of information analysis The prediction, and further use of information dissemination to the influence maximization, for business promotion, advertising and marketing, to provide decision support public opinion monitoring, has become a hot topic of current social network research. Aiming at the above problems, firstly the structure of the cascade of information mining, identified several typical patterns of structure of social network information cascade, and to predict the structure of information dissemination and utilization mode; then based on the mode of information dissemination, the analysis of the interactive model as well as information dissemination, find the most influential nodes for information back; at the end of the budget in a given situation, how to motivate the most influential nodes through the budget allocation, which makes the influence the diffusion can reach the maximum. The main contributions of this thesis can be summarized as follows: (1) the cascade structure analysis of information dissemination, and through the connection level The communication model of forecast information in the future. In the social network, information structure and information dissemination cascade often influence each other. First of all, the dissemination of information driven by different mechanisms lead to a cascade of different structure, leading the development tend to homogeneity cascade structure wide and shallow, and cascade leading social influence will become deep and complex; secondly, information cascades with different structures will spread into different ranges and communities, thus affecting the process of information dissemination. This paper uses the method of data drive, analyzes the structure of communication information cascade, dimensionality reduction through the structure of embedded information cascade (embedding) and spectral clustering (spectral, clustering) identify the information cascade of social networks in five typical modes of the structure, and found the obvious characteristic differences between different modes of the information cascade. According to the above observations, the The introduction of cascade structure to predict the mode of transmission of information in the future, the experimental results show that this method can significantly improve the prediction accuracy. (2) the interaction model studied a variety of information dissemination and recognition at the same time, one of the nodes influential. Social network often has many kinds of information in the dissemination of information at the same time, but also may exist between competition, mutual benefit relations. In view of this situation, this paper designs the interactive information cascade model to describe the spread of a variety of information, can also choose the preference information of the interaction between the user and the interactive information. In this model, the paper proves that this problem is NP hard, and put forward a backtracking based on Markov random walk (Markov random walk) algorithm: the assumption that information transmission can reach all nodes, and then through the back propagation model, find out the information May be the source of the node is the most influential. Simulation results show that compared with other algorithms, the proposed algorithm can achieve the best effect in most cases. At the same time, the algorithm can also fast convergence, so it is very efficient. (3) proposed a budget based on distribution strategy, realize the influence maximization through initial user incentive in social networks. In order to realize the influence maximization incentive initial users, previous work generally assume that the user has a certain ideal valuation, only the allocation of budget is higher than the valuation, the user will become the initial user; but in fact, in the different budget, users are likely to become the initial user. This paper use the utility function (utility function) to describe the user's satisfaction, assume that the user valuations meet the probability distribution function of some. This model is proved by reduction, the difficulty of the problem. At the same time, we propose a discrete greedy algorithm to find the budget allocation scheme: first the budget will be uniformly discrete, then iterative method using the budget successively assigned to the user with maximum marginal gain. This method can obtain near optimal results in the discrete setting. Further, this paper also proves that when selecting a discrete particle size, the algorithm can achieve 1-1/e-o in the setting of budget under continuous (1) performance guarantee. Finally, through the method of updating the marginal gain of the calculation and estimation of propagation probability to enhance the efficiency of the algorithm. The experimental results show that compared with other existing methods, discrete greedy algorithm can significantly improve the coverage of information, also have very good scalability.
【学位授予单位】:南京大学
【学位级别】:博士
【学位授予年份】:2016
【分类号】:G206;TP301.6
【相似文献】
相关期刊论文 前10条
1 彭兰;;从社区到社会网络——一种互联网研究视野与方法的拓展[J];国际新闻界;2009年05期
2 王琪;;嵌入互联网中的社会网络—企业电子社会网络[J];企业经济;2011年04期
3 李春霞;;网络媒体对社会网络的影响[J];河北大学学报(哲学社会科学版);2013年01期
4 阮冰;朱建冲;姜礼平;汲万锋;;基于社会网络的民意形成演化建模与仿真研究[J];计算机仿真;2011年02期
5 刘晶;张秀兰;;谈社会网络在图书馆的应用[J];新世纪图书馆;2011年09期
6 秦红霞;陈华东;;社会网络视角的企业知识共享演化博弈分析[J];情报杂志;2009年05期
7 王煜全;;警惕互联网上的“国家模式”——再谈社会网络的进化机制[J];互联网周刊;2011年02期
8 陈萍;;社会网络中企业知识资源的互补性[J];图书与情报;2007年05期
9 黎刚;;文献信息社会网络建设新论[J];职业技术;2007年24期
10 张星;蔡淑琴;夏火松;侯德林;;基于社会网络的企业知识管理系统框架研究[J];现代图书情报技术;2011年05期
相关会议论文 前10条
1 郭永昌;;中国大城市流动人口社会网络构筑的空间过程研究[A];2006年中国可持续发展论坛——中国可持续发展研究会2006学术年会经济发展与人文关怀专辑[C];2006年
2 程平;;基于社会网络的“云会计”知识流动研究[A];第十届全国会计信息化年会论文集[C];2011年
3 马宗正;杨永芳;;贫困地区农村社会网络与农民发展——对宁夏固原市五个村落的调查与思考[A];西部发展评论(2005年第2期 总第16期)[C];2005年
4 陆双梅;;藏民社会网络在手机中的呈现与重构[A];第四届中国少数民族地区信息传播与社会发展论丛[C];2012年
5 周静;;社会网络在营销实践中的研究初探[A];中国高等院校市场学研究会2011年年会论文集[C];2011年
6 周尚意;吴莉萍;王策;;都市更新中社区社会网络变迁的结构主义分析——以北京西单南太常社区整体搬迁为例[A];中国地理学会百年庆典学术论文摘要集[C];2009年
7 陈忠卫;王志成;;社会资本对企业成长的推动作用分析[A];2004年中国管理科学学术会议论文集[C];2004年
8 陈典全;黄朝阳;;基于位置的社会网络(LBSN)研究及其产业化[A];第二届中国卫星导航学术年会电子文集[C];2011年
9 李莉;武邦涛;陈忠;;社会网络作为双刃剑:交易网络的摩擦、中介可能性与结构洞[A];第五届全国复杂网络学术会议论文(摘要)汇集[C];2009年
10 郭彦丽;;社会网络视角下组织内部信息资源共享研究[A];信息资源配置理论与模型研究——2009信息化与信息资源管理学术研讨会专集[C];2009年
相关重要报纸文章 前10条
1 本报记者 范昕;面对巨大的社会网络,你无法独立存在[N];文汇报;2013年
2 本报记者 蔡双喜;家政服务员如何建构社会网络[N];中国妇女报;2013年
3 ;Google对搜索人感兴趣[N];计算机世界;2004年
4 周丽萍;社会资本在保险业发展中的作用[N];中国保险报;2003年
5 席来旺;社会网络提高竞争优势[N];人民日报;2007年
6 沈慧婷 本报记者 丁秀伟;从“择偶途径”看改革30年婚恋变迁[N];中国妇女报;2008年
7 北京大学博士后 山东大学教授 博导 李春霞;家政服务员的社会网络及其城乡差异[N];中国妇女报;2013年
8 贾利强;人物研究须重视社会网络与日常生活[N];中国社会科学报;2011年
9 梁捷;节点人际关系[N];经济观察报;2012年
10 ;加强理论研究 推动社会发展[N];中国社会科学院报;2008年
相关博士学位论文 前10条
1 杜晓林;大规模社会网络可视化若干问题及算法研究[D];哈尔滨工业大学;2015年
2 李栋;在线社会网络中信息扩散研究[D];哈尔滨工业大学;2014年
3 易成岐;社会网络的信息传播机制及控制方法研究[D];哈尔滨理工大学;2016年
4 张伯雷;社会网络信息传播与影响力最大化研究[D];南京大学;2016年
5 李文金;创业者社会网络的演化过程研究[D];吉林大学;2012年
6 裴志军;社会网络与经济发展[D];浙江大学;2010年
7 苏春艳;社会网络与职业获得[D];上海大学;2005年
8 高红艳;社会网络与“新生存空间”的生成[D];上海大学;2007年
9 伍满桂;创业企业网络动态能力与创新社会网络沃度研究[D];浙江大学;2008年
10 黄亮;社会网络中的社区发现与链接预测算法研究[D];华中科技大学;2012年
相关硕士学位论文 前10条
1 吴迪;《在线社会网络中产生信任评价的可信图》翻译实践报告[D];内蒙古大学;2015年
2 于洋;国有企业高管社会网络与企业创新行为关系研究[D];辽宁大学;2015年
3 周新;建筑行业农民工社会网络对收入状况的影响研究[D];西南交通大学;2015年
4 闫晶星;基于敏感关系的社会网络隐私保护方法研究[D];河北工程大学;2015年
5 王美;社会网络视角下的装备制造业产业集群创新研究[D];集美大学;2015年
6 杜宇;社会网络对中小企业融资可获性的作用[D];苏州大学;2015年
7 张玉志;社会网络中知识流动的逻辑研究[D];西南大学;2015年
8 王利娟;都市菜贩的社会网络建构[D];西南大学;2015年
9 李超;多维社会网络上的信息挖掘问题研究[D];电子科技大学;2014年
10 王诗懿;GraphLab云计算平台下社会网络的社区识别[D];宁波大学;2015年
,本文编号:1443956
本文链接:https://www.wllwen.com/xinwenchuanbolunwen/1443956.html