基于Hadoop的微博网络影响力最大化研究与实现
本文关键词:基于Hadoop的微博网络影响力最大化研究与实现,由笔耕文化传播整理发布。
【摘要】:随着互联网技术的蓬勃发展,大量社交媒体已经成为人们生活必不可少的一部分,主要有Facebook,Twitter,微博等。其中新浪微博已成为人们互相沟通,传播信息的一个重要途径。近年来针对新浪微博的各类研究纷纷兴起,其中影响力最大化的研究已成为热点研究对象之一。影响力最大化问题就是在网络中找到大小为k的具有最大影响范围的节点集。这在舆情监控和商业广告投放等方面具有巨大的潜在价值。目前,针对社会网络的影响力最大化算法的研究已经相对成熟。这些传统算法对于各种社会网络具有普遍的适用性。然而适用性的弊端在于欠缺对于某个具体社会网络(如微博网络)的针对性,导致这些算法在微博网络中的准确率较低而时间复杂度极高。本文针对上述问题提出了基于Hadoop的微博网络影响力最大化算法。本算法充分考虑微博网络自身的特性,重新定义了用户间影响力和用户激活阈值用来计算每个微博用户潜在影响力值(PI值)。启发阶段中每次都选取PI最大的用户作为种子节点去激活其他用户并更新在激活过程中被影响到的用户的PI值,之后在贪心阶段中每次都选取具有最大影响范围增量的用户作为种子节点。同时,本算法的设计是基于Hadoop分布式计算框架之上,这样就可以充分利用Hadoop分布式计算平台强大的数据处理能力来解决微博网络计算数据量庞大的问题。最后设计并实现了一个运用本文算法计算微博影响力最大化的系统来将提出的想法应用于实际。本文在Hadoop分布式计算平台上通过一系列与传统贪婪算法的对比实验来验证本文算法的优越性,其中实验所用到的原始数据均为真实的新浪微博用户数据。通过实验发现,在某些的参数条件下,本文算法的影响范围要远远好于贪婪算法,而算法的计算时间却远小于贪婪算法。所以本文算法在微博网络上的影响范围和时间复杂度都有较好的表现,相较于传统贪婪算法具有一定的优越性。
【关键词】:Hadoop 影响力最大化 微博网络 启发式算法 贪心算法
【学位授予单位】:浙江工业大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP393.09
【目录】:
- 摘要5-6
- ABSTRACT6-10
- 第1章 绪论10-18
- 1.1 研究背景及意义10-12
- 1.2 国内外研究现状12-16
- 1.2.1 影响力传播模型研究现状12-13
- 1.2.2 影响力最大化算法研究现状13-16
- 1.3 本文研究内容和组织结构16-18
- 第2章 相关理论知识18-34
- 2.1 Hadoop分布式计算平台18-26
- 2.1.1 分布式文件系统HDFS19-22
- 2.1.2 MapReduce并行计算框架22-26
- 2.2 微博网络影响力最大化算法26-33
- 2.2.1 微博网络影响力传播最大化26-27
- 2.2.2 线性阈值模型定义27-28
- 2.2.3 KK算法28-29
- 2.2.4 HPG算法29-31
- 2.2.5 TBH算法31-33
- 2.3 本章小结33-34
- 第3章 基于Hadoop的微博影响力最大化算法34-44
- 3.1 算法设计思路及框架34-36
- 3.1.1 算法设计思路34-35
- 3.1.2 算法框架35-36
- 3.2 算法重要参数定义36-40
- 3.2.1 用户信息活跃度36-38
- 3.2.2 节点影响力38-39
- 3.2.3 节点激活阈值39-40
- 3.3 算法性能测试及分析40-43
- 3.3.1 实验环境和数据集40-41
- 3.3.2 实验设计41
- 3.3.3 性能评估41-43
- 3.4 本章小结43-44
- 第4章 影响力最大化系统设计与实现44-59
- 4.1 系统开发环境44-47
- 4.1.1 开发环境44-47
- 4.1.2 运行环境47
- 4.2 系统总体架构47-51
- 4.2.1 数据库设计47-48
- 4.2.2 系统整体设计48-51
- 4.3 重要功能模块实现51-58
- 4.3.1 用户管理模块51-54
- 4.3.2 Hadoop计算及查看模块54-58
- 4.3.3 系统日志模块58
- 4.4 本章小结58-59
- 第5章 总结与展望59-61
- 5.1 总结59-60
- 5.2 展望60-61
- 参考文献61-64
- 致谢64-65
- 攻读学位期间参加的科研项目和成果65
【相似文献】
中国期刊全文数据库 前10条
1 徐颉;;“2009中国电视网络影响力”榜单出炉[J];传媒;2009年07期
2 李德刚;李岭涛;;利用网络效应,提升电视价值——2009中国电视网络影响力报告综述[J];中国广播电视学刊;2009年08期
3 ;中国电视网络影响力2009年度排行榜[J];传媒;2010年07期
4 陈明;;评价体系:如何在构建中完善——对《中国电视网络影响力报告》的商榷和建议[J];江汉大学学报(人文科学版);2011年03期
5 ;中国网络影响力第四届中国网络影响力颁布盛典隆重举行[J];现代传播(中国传媒大学学报);2011年08期
6 本刊编辑部;;湖南卫视网络影响力居行业首位[J];声屏世界·广告人;2013年09期
7 任景华;;关于网络影响力的若干思考[J];运城学院学报;2008年06期
8 李岭涛;黄宝书;;网络影响力——电视评价新指标[J];中国广播电视学刊;2008年07期
9 李德刚;李岭涛;;电视网络影响力:媒介研究的新领域——兼评2008年度中国电视网络影响力调查结果[J];广播电视信息(上半月刊);2008年07期
10 ;电视网络影响力与传播通路创新高峰论坛精彩上演[J];中国广告;2009年06期
中国重要报纸全文数据库 前7条
1 本报记者 苏娟;打造中国新型电视评价体系——网络影响力[N];中华新闻报;2008年
2 沈彤;依然是最活跃的力量[N];中国计算机报;2002年
3 肖华;网络影响力莫成对“收视率”的换汤[N];中国改革报;2008年
4 王彤;电视节目评价新标准出台[N];中国改革报;2008年
5 徐维欣;中国TV诞生网络影响力指标[N];文汇报;2008年
6 记者 周骥 通讯员 贝红兵;宁波电视台荣膺中国最具网络影响力城市电视台称号[N];宁波日报;2011年
7 范淑华 王馨妍;中华老字号网络影响力年度排行榜[N];商务时报;2009年
中国硕士学位论文全文数据库 前8条
1 胡美兰;学术网络的影响力最大化研究[D];内蒙古大学;2016年
2 于龙;关联用户影响力属性的网络广告投放决策方法[D];合肥工业大学;2016年
3 杨圩生;复杂网络影响力算法分析与应用研究[D];国防科学技术大学;2014年
4 经志军;基于Hadoop的微博网络影响力最大化研究与实现[D];浙江工业大学;2016年
5 黄山青;中国林业类高校网站的网络影响力评价研究[D];南京林业大学;2011年
6 兰娜;我国省级公共图书馆网站网络影响力评估研究[D];河北大学;2015年
7 兰荣;我国五个自治区党报网站影响力研究[D];中央民族大学;2013年
8 黎雷;社会网络影响力模型及其算法研究[D];北京交通大学;2010年
本文关键词:基于Hadoop的微博网络影响力最大化研究与实现,,由笔耕文化传播整理发布。
本文编号:359889
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/359889.html