基于多维属性的社会网络信息传播模型研究
发布时间:2018-11-28 21:05
【摘要】:近几年,随着社会化媒体平台的迅速发展,如:Facebook、Twitter、Youtube、WhatApp、微博、微信等,社会化媒体分析已经成为一个非常热门的研究领域。社会网络信息传播是社会化媒体数据中最重要和最普遍的特征之一,研究信息在社会网络中的传播情况以及影响因素已经成为社会化媒体分析领域的重要课题之一,并受到研究人员的广泛关注和研究。研究社会媒体中的信息传播分析模型及模式,对分析社会网络中的社会节点属性特征、理解社会网络结构、社会网络信息流向、分析和预测信息传播的广度和深度等具有非常重要的理论意义。同时,研究社会网络信息传播也具有非常广泛的应用价值,目前正逐步应用在舆情监控与分析、谣言追踪、企业营销、个性化精准营销等众多领域。 本文旨在研究社会化媒体中的基于网络属性的信息传播模型。在数据准备方面,本文研发出一种并行、高效的数据获取系统。通过考虑社会网络中的静态属性(包括网络属性、非网络属性)和动态属性,本文提出一种位置信息与社区结构的关联分析方法,给出四种轨迹模式的定义及抽取算法,并在此基础上提出了基于位置信息和社区结构信息社会网络信息传播模型;针对用户的网络结构属性和非网络结构属性,提出了一种多层的信息网络融合方法(MLN),给出一种基于MLN的信息传播模型;针对用户属性的动态性,提出一种基于N-Pat-Tree结构的新词发现方法,给出一种社会网络的动态属性融合方法,并在此基础上提出一种新的信息传播模型及验证方法。总体而言,本论文主要的研究成果和创新之处主要体现在以下几个方面: (1)大规模社会化媒体数据获取和定向分析 数据获取是开展社会媒体数据分析与挖掘的基础。与传统的数据相比,社会化媒体数据具有如下几个特点:数据体量大、数据结构复杂、数据内容丰富、数据获取方式灵活等。本文基于社会化媒体平台的特点,研发并行、实时的社会化媒体数据获取系统,并在此基础上,对社会网络节点的属性特征和规律进行了定向分析。本部分的具体工作主要体现在:分析了社会网络节点的空间行为,提出了节点的主要活动位置这一定义;基于节点的社区结构信息,分析了用户的空间位置聚类与用户网络社区之间的关联程度,提出了信息熵这一概念,用于描述空间聚类下用户关系的混乱程度和同一社区下用户位置的分布情况等;统计分析了大规模社会化媒体数据中的节点的空间运动轨迹,提出了四种社会网络节点的轨迹行为模式,并在城市间紧密程度及热门城市发现方面做了实证研究。本部分的工作为后续的信息传播研究提供良好的数据基础和理论基础。 (2)基于位置信息和社区结构信息的社会网络信息传播分析 当前对社会网络信息传播的研究侧重于网络结构对信息传播的影响,忽略了节点的属性以及节点自身所处的环境对信息传播的影响。针对这一问题,本文基于社会化媒体数据中的网络节点分析结果,提出了基于位置信息和社区结构信息社会网络信息传播模型。具体工作体现在:引入社会网络节点的位置信息和社区结构信息,针对不同的节点属性给出不同的传播参数,保证了信息的差异化传播;通过引入位置信息,保证事发地节点对信息传播的可信性,有利于对事件的传播范围进行定性分析;引入社区结构信息,增强了节点之间进行信息传播的可信性,有利于对事件的传播范围进行定量分析。因此,本部分提出的基于位置信息和社区结构信息的信息传播模型,有助于对事件传播进行定性和定量分析,对重大事件的监控和应急处理具有非常重要的应用价值。 (3)多层的静态信息网络融合方法和信息传播模型 在社会化媒体平台上,用户往往会发表自己感兴趣的信息,结交朋友,浏览和评论朋友的信息等,因此,社会媒体中的用户都具有网络属性(朋友关系)和非网络属性(个体行为),如何充分利用上述两类信息来研究信息传播模型,具有很重要的意义。本文将用户自身所具有网络结构属性和非网络结构属性按层进行融合,提出了一种多层的信息网络融合方法(MLN),其中每一层表示个体间不同类型的关系或属性。在此基础上,我们提出一种基于MLN的信息传播模型,并在四种真实的微博数据集上进行了实验验证。实验结果表明,多层网络融合方法和提出的基于MLN的信息传播模型在发现活跃用户方面具有更好的准确性。 (4)基于动态属性的社会网络节点相似度计算方法和信息传播模型 社会化媒体中的用户属性(包括网络属性和非网络属性),往往会受到用户当前行为的影响并随着时间动态变化。为了研究上述动态属性及其信息传播模型,本文对用户当前发表和转播的信息内容、关注的话题和标注的标签等关键词进行提取,并通过相似度矩阵计算网络节点间的相似度,提出一种社会网络的动态属性融合方法,并在此基础上给出新的信息传播模型及验证方法。在关键词提取过程中,,我们发现社会化媒体正在产生越来越多的网络新词,这为关键词的提取及用户行为的分析提出了挑战。为解决这一问题,本文提出一种基于N-Pat-Tree结构的新词发现方法,给出一些新的过滤机制,提出一种多维度发现及分析网络新词的算法,并将该算法应用在真实的微博数据中,证明了上述算法的有效性,同时发现很多有意义的结果。
[Abstract]:......
【学位授予单位】:中国科学院深圳先进技术研究院
【学位级别】:博士
【学位授予年份】:2014
【分类号】:TP393.02
本文编号:2364248
[Abstract]:......
【学位授予单位】:中国科学院深圳先进技术研究院
【学位级别】:博士
【学位授予年份】:2014
【分类号】:TP393.02
【参考文献】
相关期刊论文 前10条
1 陈萌;汤志伟;;社会网络分析法在QQ群虚拟学习社区中的应用分析——以某专业硕士QQ群为例[J];电子科技大学学报(社科版);2011年03期
2 熊文海;赵继军;S.Boccaletti;V.Latora;Y.Moreno;M.Chavezf;D.-U.Hwang;;复杂网络:结构与动力学(英文)[J];复杂系统与复杂性科学;2006年04期
3 刘志明;刘鲁;;微博网络舆情中的意见领袖识别及分析[J];系统工程;2011年06期
4 金永生;王睿;陈祥兵;;企业微博营销效果和粉丝数量的短期互动模型[J];管理科学;2011年04期
5 李保利,俞士汶;话题识别与跟踪研究[J];计算机工程与应用;2003年17期
6 许晓东;肖银涛;朱士瑞;;微博社区的谣言传播仿真研究[J];计算机工程;2011年10期
7 王飞跃;曾大军;毛文吉;;社会计算的意义、发展与研究状况[J];科研信息化技术与应用;2010年02期
8 王明会;丁焰;白良;;社会化媒体发展现状及其趋势分析[J];信息通信技术;2011年05期
9 黄令贺;葛敬民;;微博客及其在高校图书馆中的应用模式的研究[J];情报理论与实践;2010年04期
10 王晓光;袁毅;滕思琦;;微博社区交流网络结构的实证分析[J];情报杂志;2011年02期
本文编号:2364248
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2364248.html