当前位置:主页 > 文艺论文 > 广告艺术论文 >

特定话题域的微博用户影响力研究与实现

发布时间:2019-11-01 19:14
【摘要】:微博作为近几年来最热门的社交网络平台之一,其用户数量、用户活跃度、都以惊人的速度持续增长着。微博上的信息传播具有核裂变式的特点,信息产生速度快、传播速度快。微博的自媒体特性使得每个人都有在互联网上制造和快速传播自己观点的能力。在微博用户中,少数有影响力的用户担任着话题领袖的角色,他们利用自身的影响力推动信息的传播、影响公众的舆论。对微博用户的影响力进行分析,不仅可以用于广告投放、公关推广、市场营销、信息推荐等领域,还能给微博网上的舆情监控提供一种有效的解决途径。目前关于微博用户影响力分析有很多相关研究,其中通过粉丝数、转发数、用户活跃度等指标评定用户影响力是一种常见的简便的方法。更多的研究则借鉴网页排序算法,通过随机游走模拟用户在微博平台上的浏览行为,设计微博用户影响力评估算法,得到用户的影响力。目前的微博用户影响力评估大多针对用户的综合影响力,而没有对用户的影响力进行进一步的划分。用户在不同的领域和行业的活跃度不同,其影响力大小也存在区别。本文提出一种针对特定话题域的微博用户影响力评估算法,通过对用户发布的微博中的文本内容进行分析,提取话题特征向量,得到用户在特定话题下的话题信息量,用余弦夹角公式计算用户的话题相似性;结合用户间的转发关系,设计特定话题域的微博用户影响力分析算法算法,得到用户在特定话题域下的影响力排名。主要工作和创新点包括:1.通过构造特定话题域的特征词库,对用户发表的微博文本内容进行语义分析,提取用户的话题特征向量,计算用户的话题信息量。并通过用户的话题特征向量,计算用户间的话题相似性。2.基于PageRank算法设计特定话题域的微博用户影响力分析算法算法,在转发网络中进行随机游走,并基于用户话题相似性设置网络中的转移概率,基于用户的话题信息量设置网络中随机跳转概率,迭代计算,得到特定话题域的用户影响力排名。3.基于Hadoop分布式平台搭建影响力分析系统,用HDFS分布式系统存储从互联网上爬取的微博数据,并基于MapReduce编程思想实现影响力分析的各个模块。通过实验对新浪微博用户计算在“国内时政热点”领域的影响力排名,分析实验结果并与其它影响力分析算法对比,评价算法的性能。并通过对不同节点数的Hadoop集群进行算法性能测试,验证了算法在Hadoop分布式实验平台中具有极强的数据吞吐量和强大的计算性能。
【图文】:

特征词,次数分布,数据集中,特征分析


特征词提及数分布

谣言,昵称,粉丝,央视


图 6.7 转发微博所占比例分布总共有多少转发关系6.3.3 用户影响力排名分析本实验选择 值为 1.85,,迭代次数为 20 次,得到用户影响力的全序排名。名前十的用户如下表所示:表 6.2 TFSUR 影响力排名前十用户列表用户昵称 粉丝数 微博数量 关注数头条新闻 21793054 76019 195新华视点 8026644 39849 630央视新闻 8662313 19521 152李开复 51666049 13634 551京华时报 2699966 233378 352思想聚焦 3099457 28377 1908南都周刊 4206422 16330 1490凤凰网 462130 7072 403谣言粉碎机 519649 1408 74正义公正者联盟 324223 9381 442
【学位授予单位】:国防科学技术大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP393.092

【相似文献】

相关期刊论文 前10条

1 李源鑫;肖如良;陈洪涛;赵婷;李宏恩;;时间衰减制导的协同过滤相似性计算[J];计算机系统应用;2013年11期

2 冯永;张洋;;基于概念间边权重的概念相似性计算方法[J];计算机应用;2012年01期

3 谢红薇;李瑞霞;余雪丽;于晓霞;;基于概念图匹配的语义相似性算法研究[J];微计算机信息;2007年21期

4 骆雯;邓学雄;赖朝安;;基于有向相似性联想的产品创新设计思维方法[J];工程图学学报;2009年05期

5 鲁慧民;冯博琴;李旭;;面向多源知识融合的扩展主题图相似性算法[J];西安交通大学学报;2010年02期

6 谢川;王方;;基于事件的物联网服务相似性检测[J];计算机应用;2011年08期

7 李金双;李凤云;;移动社会网络中用户相似性计算的隐私保护研究[J];电信科学;2013年10期

8 胡为民,邵根钧,黄浩;基于复合相似性与多样性事例复用算法的研究[J];曲阜师范大学学报(自然科学版);2005年03期

9 李文超;杨妮妮;;基于本体的语义相似性研究[J];科学技术与工程;2012年21期

10 傅贤超;;基于GPU加速的图像双向相似性计算[J];现代计算机;2013年16期

相关博士学位论文 前2条

1 李龙杰;复杂网络中链接预测与角色相似性计算方法研究[D];兰州大学;2014年

2 冯德瀛;图像检索技术中相似性搜索方法研究[D];上海交通大学;2013年

相关硕士学位论文 前10条

1 刘冬;植物miRNA及其功能的预测方法研究与实现[D];大连理工大学;2015年

2 邹雪晴;特定话题域的微博用户影响力研究与实现[D];国防科学技术大学;2013年

3 张善镇;基于语义相似性和等级结构数据计算基因间表型相似性[D];哈尔滨医科大学;2012年

4 马静;基于路径映射的图相似性计算方法研究[D];辽宁大学;2012年

5 张琦;基于三维结构的蛋白质相似性判定方法研究[D];中南大学;2009年

6 王建彬;基于相似性博客推荐技术的研究与应用[D];内蒙古科技大学;2012年

7 吕金涛;基于频繁子模式的图形相似性搜索研究[D];重庆大学;2009年

8 刘丹;GO术语间语义相似性的度量方法[D];东北师范大学;2008年

9 李小慧;基于Jaccard项目类别相似性的个性化推荐算法研究[D];中南大学;2010年

10 韦清芳;CAPP中零件工艺相似性判定技术的研究[D];四川大学;2003年



本文编号:2554099

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/guanggaoshejilunwen/2554099.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户04781***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com