基于Hadoop的微博用户及微博影响力排名研究
本文关键词:基于Hadoop的微博用户及微博影响力排名研究
更多相关文章: PageRank 新浪微博 NPRank算法 TRank算法 Hadoop
【摘要】:随着Web2.0时代的到来,用户主导因素在互联网中占了越来越重要的地位,以微博为首的社交网络平台更是得到了空前的发展。当前,微博已经成为了资讯传递与社会舆论传播的一个重要平台,是社会热点信息传递的新风向标。为此,分析微博用户影响力及微博影响力具有重要的研究意义及商业价值。本文主要分微博用户影响力及微博影响力两部分展开研究。对于微博用户影响力的评定,当前应用较为广泛的是基于Page Rank算法模型的People Rank算法,但People Rank算法只是简单的将网页排名模型应用于微博用户影响力排名中,其对用户影响力评定的精确度还有待完善。本文则是以新浪微博个人认证这一影响因素作为切入点,提出了一种基于People Rank算法的优化方案——NPRank(New People Rank)算法。对于微博影响力的评定,目前较常用的方法是以微博的转发数和评论数作为评定标准,此方法考虑的指标不够全面,对微博影响力评定的可靠性有待提高。而本文则是在考虑微博的转发数、评论数和点赞数的情况下,加入了微博发布者的用户影响力这一因素作为微博影响力的评定标准,并提出了一种微博影响力评定方法——TRank(Topic Rank)算法。针对微博用户影响力排名及微博影响力排名需进行海量数据处理的特点,本文还通过实验证明了NPRank算法和TRank算法在Hadoop平台上的可行性,并对实验结果展开了对比分析,验证了NPRank算法相较于People Rank算法在用户影响力评定精确度得到的优化,及TRank算法在微博影响力评定上有着较强可靠性。最后,基于NPRank及TRank得到的排名结果,本文还提出新浪微博影响力排名展示系统的设计方案。
【学位授予单位】:暨南大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP393.092;TP311.13
【参考文献】
中国期刊全文数据库 前10条
1 马建光;姜巍;;大数据的概念、特征及其应用[J];国防科技;2013年02期
2 白云川;;利用大数据的商业价值[J];中国制造业信息化;2011年20期
3 马俊;周刚;许斌;黄永忠;;基于个人属性特征的微博用户影响力分析[J];计算机应用研究;2013年08期
4 张一文;齐佳音;方滨兴;李欲晓;;非常规突发事件网络舆情热度评价指标体系构建[J];情报杂志;2010年11期
5 廉捷;周欣;曹伟;刘云;;新浪微博数据挖掘方案[J];清华大学学报(自然科学版);2011年10期
6 张岩;郭松;赵国海;;基于Hadoop的云计算试验平台搭建研究[J];沈阳师范大学学报(自然科学版);2013年01期
7 孙广中;肖锋;熊曦;;MapReduce模型的调度及容错机制研究[J];微电子学与计算机;2007年09期
8 舒正渝;;浅谈数据挖掘技术及其应用[J];中国西部科技;2010年05期
9 李军;陈震;黄霁崴;;微博影响力评价研究[J];信息网络安全;2012年03期
10 石磊;张聪;卫琳;;引入活跃指数的微博用户排名机制[J];小型微型计算机系统;2012年01期
中国硕士学位论文全文数据库 前2条
1 王佳;支持Ajax技术的主题网络爬虫系统研究与实现[D];北京交通大学;2011年
2 陈浩;基于Hadoop的微博用户影响力排名算法研究[D];华东理工大学;2014年
,本文编号:1294122
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1294122.html