当前位置:主页 > 社科论文 > 新闻传播论文 >

在线社会网络关键用户挖掘方法研究

发布时间:2018-03-07 11:12

  本文选题:在线社会网络 切入点:关键用户 出处:《哈尔滨工程大学》2016年博士论文 论文类型:学位论文


【摘要】:近年来,Facebook、Twitter、微博、微信等社交网站已经逐渐成为人们日常生活中的主要社交渠道。人们可以随时随地通过社交媒体建立各种交互关系,从而产生了不同层次和粒度的虚拟在线社交网络。在线社会网络由动态变化的用户和他们的交互关系组成,以支撑网络信息和数据的即时交换。因此,在线社会网络关键用户挖掘方法研究可以帮助企业进行产品推广、帮助政府进行舆情分析、预警与调控,具有实际应用价值。本文以真实的在线社会网络数据为研究对象,主要针对热点话题意见领袖挖掘、持久话题中关键人物分析、信息溯源研究中关键用户提取、信息传播引擎节点挖掘等问题展开研究,并在虚假信息控制和高效网络营销上进行了应用性研究。本文的研究内容主要包括以下四个部分:首先,现有的意见领袖挖掘算法都没有考虑在特定话题中来分析用户的重要程度,应用传统聚类方法很难把某一话题的相关帖子准确地识别并聚类到一起,传统的热点话题意见领袖挖掘方法很难达到预期效果,而且文本的情感分析在舆论领袖挖掘中的应用问题也有待解决。本文提出一种基于话题模型的意见领袖挖掘算法TOLM(Topic Opinion Leader Mining),以真实 BBS(Bulletin Board System)论坛为研究对象,应用 LDA(Latent Dirichlet Allocation)话题模型计算标题的相似度并自动聚类,构建变规模用户回复关系网络模型,通过社会网络分析得到意见领袖以及不同观点派别,能有效捕捉舆情并分析舆论传播特点,对及时疏导舆情有一定意义。本文提出的意见领袖挖掘算法旨在快速发现某一网络热门事件中的意见领袖,综合考虑的帖子的话题属性、情感倾向和网络结构关系,具有较高的实用性。其次,作为一个实时性公共信息平台,BBS上的话题分为突发性话题和持久性话题,其中持久性话题多为贴近生活的民生话题,拥有较长的时间跨度。持久话题中关键用户挖掘的难点在于持久话题的发现与提取和稀疏网络中关键节点挖掘。基于此,文章提出持久性话题中关键人物的分析方法,主要包括持久话题的识别算法和在持久话题社会网络中通过情感加权的节点位置分析来提取关键人物的算法两部分。持久话题的识别主要结合LDA模型和相似度模型并在时间轴上进行刻画。关键人物提取为一种考虑了邻居节点的位置、网络中节点关系的强弱及情感倾向的局部节点位置确定方法。算法在真实数据集验证了有效性。再次,做为一种典型的社交网络平台,微博信息传播速度快,如何准确锁定信息的精准源头是舆情预警的关键。针对现有的算法仅仅找到时间戳最早的节点,没有考虑节点的社会网络关系(好友、关注等)和信息的语义关系的问题,本章以新媒体微博信息传播机制为例,提出了一种信息传播溯源算法ITEAE(Initiators and Early Adopters Extraction)。首先,根据微博转发关系建立级联(会话树)并按主题相关性进行聚类得到级联的集合(会话森林);其次,结合用户关系网和信息级联关系网确定微博信息的真正发起者;再次,通过文本情感分析和信息级联关系迭代计算节点的影响力指数和从众指数,提取微博信息早期重要参与者;最后,分析发起者和早期重要参与者确定信息源头并进行实验评估,并通过删除优质源头节点和全局高影响力节点来控制虚假信息的传播,实验在新浪微博数据集上验证了算法的有效性。相比于已有的研究,本文算法能够通过转发关系形成的级联集合进行信息的溯源。最后,以转发为传播机制微博平台上,信息经常以“引擎节点”为中心进行“核裂变”式传播,挖掘这些“引擎节点”来进行微博营销是一种成本低效率高的营销手段。其问题的关键是准确寻找网络中有影响力的节点作为触发品牌知名度的少数用户,保证在较少投入情况下获得较大收益。基于此,文章提出了一种引擎节点挖掘算法,首先,基于微博转发关系形成信息级联并按时间戳进行剪枝,其次,按话题相关性生成信息级联树,通过计算节点的综合扩散能力来提取不同精度下的引擎节点,最后,以这些引擎节点作为初始传播节点进行信息传播演化,实验结果表明,利用引擎节点进行作为初始节点能够使信息传播速度更快、范围更大。
[Abstract]:In recent years, Facebook, Twitter, micro-blog, WeChat and other social networking sites have gradually become the main social channels in people's daily life. People can set up various interactive relationship whenever and wherever possible through social media, to create a virtual network of online social network and different levels of granularity. The online social network is composed of the dynamic changes of users and their interactions to exchange instant support, network information and data. Therefore, can help enterprises to promote the product key users of online social network mining method research, public opinion analysis of government help, warning and controlling, and has practical application value. Based on the data of real online social network as the research object, mainly aimed at the hot topic opinion leader mining and analysis key figures lasting topic, key user research information traceability extraction, information dissemination engine node digging questions Study, and Application Research on false information control and efficient network marketing. The main contents of this paper include the following four parts: firstly, the existing opinion leader mining algorithms do not consider the degree of importance in specific topics to analyze the user's application, the traditional clustering method is very difficult to post a topic the accurate identification and clustering together, hot topic opinion leaders in the traditional mining method is difficult to achieve the desired effect, and text sentiment analysis application in opinion leaders in mining has yet to be resolved. This paper proposes a mining algorithm of TOLM topic model based on opinion leaders (Topic Opinion Leader Mining), with the real BBS (Bulletin Board System) forum as the research object, the application of LDA (Latent Dirichlet Allocation) similarity calculation model and title topic clustering, construction of variable size Users reply relation network model, through social network analysis from different views of opinion leaders and factions, can effectively capture the public opinion and public opinion analysis, has a certain significance for timely public opinion. This opinion leader mining algorithm is designed to quickly find a network of popular events in the opinion leaders, considering the topic attribute post that sentiment and network structure, with high practicality. Secondly, as a real-time public information platform, BBS on the topic is divided into hot topics and persistent topics, including persistent topic for people's livelihood topics close to the life, have a longer time span. Key users lasting topic mining is the key node discovery and lasting topic extraction and sparse network mining. Based on this, the article puts forward analysis method of key figures in the main topic of persistence. To identify algorithm including persistent topic and emotion in the weighted by enduring subject in social network node location analysis to extract two part of key figures. The main topic lasting recognition algorithm based on LDA model and similarity model is described in the time axis. The key figure extraction as a consideration to the neighbor node location, local node strength and emotion node relationship in the network. The method to determine the set of algorithms to verify the effectiveness of the real data. Again, as a typical social network platform, micro-blog information dissemination speed, how to accurately accurately lock source of information is the key node for public opinion warning. Existing algorithms only to find the time at the earliest, did not consider the relationship between the social network nodes (friends, attention) semantic relations and information problems, this chapter takes the information dissemination mechanism of new media micro-blog For example, ITEAE proposed an information dissemination algorithm (Initiators and Early Adopters of Extraction). First, according to micro-blog forwarding relationship cascade (session tree) and clustering set by topic correlation (cascade forest; secondly, combined with the session) to determine the real information of the user micro-blog initiator network and information cascade again, through the network; text sentiment analysis and information cascade iterative computation node influence index and conformity index, information extraction of micro-blog early participants; finally, analysis of the initiator and the early participants determine source of information and experimental evaluation, and transmitted by the source node and the global high quality delete node to control the influence of false information. Experiments verify the effectiveness of the algorithm in Sina micro-blog data set. Compared to the existing research, this algorithm can by forwarding relationship The formation of a set of information cascade traceability. Finally, the communication mechanism of the micro-blog platform for forwarding information, often with "engine node" as the center of "fission" type of communication, these "mining engine node" to micro-blog marketing is a kind of high efficiency low cost marketing tool. The key problem is accurately find influential nodes in the network as a trigger for a few users of brand awareness, ensure in less investment under the condition of large gains. Based on this, this paper proposes a mining algorithm engine node, first of all, micro-blog information and forwarding relationship between cascade pruning, according to the time stamp based on second generation information cascade by topic correlation the tree, through comprehensive diffusion capacity calculation of node to node extraction engine, different accuracy. Finally, with these engines as the initial node node dissemination of information dissemination and evolution, The experimental results show that the use of the engine node as the initial node can make the information spread faster and wider.

【学位授予单位】:哈尔滨工程大学
【学位级别】:博士
【学位授予年份】:2016
【分类号】:G206;TP393.09

【相似文献】

相关期刊论文 前10条

1 杨建梅;王舒军;陆履平;庄东;;广州软件产业社会网络与竞争关系复杂网络的分析与比较[J];管理学报;2006年06期

2 彭兰;;从社区到社会网络——一种互联网研究视野与方法的拓展[J];国际新闻界;2009年05期

3 王琪;;嵌入互联网中的社会网络—企业电子社会网络[J];企业经济;2011年04期

4 李春霞;;网络媒体对社会网络的影响[J];河北大学学报(哲学社会科学版);2013年01期

5 阮冰;朱建冲;姜礼平;汲万锋;;基于社会网络的民意形成演化建模与仿真研究[J];计算机仿真;2011年02期

6 刘晶;张秀兰;;谈社会网络在图书馆的应用[J];新世纪图书馆;2011年09期

7 秦红霞;陈华东;;社会网络视角的企业知识共享演化博弈分析[J];情报杂志;2009年05期

8 王煜全;;警惕互联网上的“国家模式”——再谈社会网络的进化机制[J];互联网周刊;2011年02期

9 陈萍;;社会网络中企业知识资源的互补性[J];图书与情报;2007年05期

10 黎刚;;文献信息社会网络建设新论[J];职业技术;2007年24期

相关会议论文 前10条

1 郭永昌;;中国大城市流动人口社会网络构筑的空间过程研究[A];2006年中国可持续发展论坛——中国可持续发展研究会2006学术年会经济发展与人文关怀专辑[C];2006年

2 程平;;基于社会网络的“云会计”知识流动研究[A];第十届全国会计信息化年会论文集[C];2011年

3 马宗正;杨永芳;;贫困地区农村社会网络与农民发展——对宁夏固原市五个村落的调查与思考[A];西部发展评论(2005年第2期 总第16期)[C];2005年

4 陆双梅;;藏民社会网络在手机中的呈现与重构[A];第四届中国少数民族地区信息传播与社会发展论丛[C];2012年

5 周静;;社会网络在营销实践中的研究初探[A];中国高等院校市场学研究会2011年年会论文集[C];2011年

6 周尚意;吴莉萍;王策;;都市更新中社区社会网络变迁的结构主义分析——以北京西单南太常社区整体搬迁为例[A];中国地理学会百年庆典学术论文摘要集[C];2009年

7 陈忠卫;王志成;;社会资本对企业成长的推动作用分析[A];2004年中国管理科学学术会议论文集[C];2004年

8 陈典全;黄朝阳;;基于位置的社会网络(LBSN)研究及其产业化[A];第二届中国卫星导航学术年会电子文集[C];2011年

9 李莉;武邦涛;陈忠;;社会网络作为双刃剑:交易网络的摩擦、中介可能性与结构洞[A];第五届全国复杂网络学术会议论文(摘要)汇集[C];2009年

10 郭彦丽;;社会网络视角下组织内部信息资源共享研究[A];信息资源配置理论与模型研究——2009信息化与信息资源管理学术研讨会专集[C];2009年

相关重要报纸文章 前10条

1 本报记者 范昕;面对巨大的社会网络,你无法独立存在[N];文汇报;2013年

2 本报记者 蔡双喜;家政服务员如何建构社会网络[N];中国妇女报;2013年

3 ;Google对搜索人感兴趣[N];计算机世界;2004年

4 周丽萍;社会资本在保险业发展中的作用[N];中国保险报;2003年

5 席来旺;社会网络提高竞争优势[N];人民日报;2007年

6 沈慧婷 本报记者 丁秀伟;从“择偶途径”看改革30年婚恋变迁[N];中国妇女报;2008年

7 北京大学博士后 山东大学教授 博导 李春霞;家政服务员的社会网络及其城乡差异[N];中国妇女报;2013年

8 贾利强;人物研究须重视社会网络与日常生活[N];中国社会科学报;2011年

9 梁捷;节点人际关系[N];经济观察报;2012年

10 ;加强理论研究 推动社会发展[N];中国社会科学院报;2008年

相关博士学位论文 前10条

1 周雪妍;在线社会网络关键用户挖掘方法研究[D];哈尔滨工程大学;2016年

2 杜晓林;大规模社会网络可视化若干问题及算法研究[D];哈尔滨工业大学;2015年

3 李栋;在线社会网络中信息扩散研究[D];哈尔滨工业大学;2014年

4 易成岐;社会网络的信息传播机制及控制方法研究[D];哈尔滨理工大学;2016年

5 张伯雷;社会网络信息传播与影响力最大化研究[D];南京大学;2016年

6 王万元;基于多Agent技术的异质社会网络群组形成方法研究[D];东南大学;2016年

7 周一峰;非可靠社会网络中多Agent系统任务合作的自适应机制研究[D];东南大学;2016年

8 吴鸿;社会网络中竞争与合作影响最大化研究[D];云南大学;2016年

9 张静;社会网络影响力建模与度量[D];清华大学;2016年

10 李文金;创业者社会网络的演化过程研究[D];吉林大学;2012年

相关硕士学位论文 前10条

1 吴迪;《在线社会网络中产生信任评价的可信图》翻译实践报告[D];内蒙古大学;2015年

2 于洋;国有企业高管社会网络与企业创新行为关系研究[D];辽宁大学;2015年

3 周新;建筑行业农民工社会网络对收入状况的影响研究[D];西南交通大学;2015年

4 闫晶星;基于敏感关系的社会网络隐私保护方法研究[D];河北工程大学;2015年

5 王美;社会网络视角下的装备制造业产业集群创新研究[D];集美大学;2015年

6 杜宇;社会网络对中小企业融资可获性的作用[D];苏州大学;2015年

7 张玉志;社会网络中知识流动的逻辑研究[D];西南大学;2015年

8 王利娟;都市菜贩的社会网络建构[D];西南大学;2015年

9 李超;多维社会网络上的信息挖掘问题研究[D];电子科技大学;2014年

10 王诗懿;GraphLab云计算平台下社会网络的社区识别[D];宁波大学;2015年



本文编号:1579046

资料下载
论文发表

本文链接:https://www.wllwen.com/xinwenchuanbolunwen/1579046.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户69f51***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com