当前位置:主页 > 管理论文 > 移动网络论文 >

社交网络用户影响力评估算法研究与分布式实现

发布时间:2017-06-29 18:07

  本文关键词:社交网络用户影响力评估算法研究与分布式实现,由笔耕文化传播整理发布。


【摘要】:以微博为代表的新型社交网络不同于传统网络,其信息传播和扩散主要依赖于海量用户之间的关系。如何使信息被更多的用户所接收,即用户影响力最大化问题,已经成为社交网络平台及其应用的研究热点。但是由于用户数据量巨大,传统集中式数据处理方式在海量数据集处理方面的高成本、低效率的限制,使得目前对于用户影响力的研究成果并不突出,平台上海量数据资源也没有得到充分利用。PageRank算法是由Google开发的用于评估页面等级的算法,该算法以页面的链出和链入情况来对页面等级进行评估。论文将社交网络用户之间的相互关注关系抽象为页面之间的链出和链入关系,将PageRank算法应用于用户影响力的分析研究中,并将用户追随者的质量,即追随者的影响力的情况也作为重要的参考因素。并以此,设计了一种改进的用户影响力评估算法——URank算法。论文给出了URank算法的设计思路和详细实现过程。粒子群PSO优化算法是一种群体智能算法,以其收敛快、易实现等优点受到学术界广泛的重视。由于用户影响力分析也是一种优化设计,因此论文提出一种基于PSO算法的用户影响力评估算法——PsoRank算法。算法综合考虑用户自身因素和其追随者质量对用户影响力的影响,扩展了常见的用户影响力评估算法所依赖的参考因素。该算法在对用户影响力进行评估时,以用户自身质量,即用户的粉丝数、发布信息的频率和信息被转发率/被评论以及用户是否认证等因素为基础,以用户追随者的质量为条件,并且将用户影响力增量因子作为算法的适应度函数来判断是否对用户的影响力进行更新。从多方面保证算法评估出的用户影响力的合理性和公正性。为了使提出的算法能够适应海量数据处理,论文提出将URank和PsoRank算法按照MapReduce分布式并行化编程模型将论文设计的用户影响力评估算法改编成分布式并行化程序。论文用真实的从新浪微博平台爬取的数据在Hadoop集群上对论文提出的分布式并行化URank和PsoRank算法进行实验验证。实验结果表明,相对于其它的用户影响力评估算法,论文提出的用户影响力评估算法可以更公正合理地反映用户真实的影响力大小。并且集群性能分析结果也表明,论文提出的并行化算法具有良好的加速比和计算效率比。因此论文提出的分布式并行化用户影响力评估算法较适合像新浪微博这样的大型社交网络平台。
【关键词】:社交网络 用户影响力 粒子群算法 PageRank MapReduce
【学位授予单位】:江苏大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP393.092;TP18
【目录】:
  • 摘要4-6
  • ABSTRACT6-11
  • 第一章 绪论11-19
  • 1.1 研究背景及意义11-12
  • 1.2 国内外研究现状12-17
  • 1.2.1 社交网络用户影响力分析12-15
  • 1.2.2 基于Hadoop平台的分布式并行算法设计15-17
  • 1.3 论文的主要工作17-18
  • 1.4 论文的组织结构18-19
  • 第二章 相关理论和技术简介19-30
  • 2.1 常用的社交网络用户影响力评估算法19-21
  • 2.1.1 基于PageRank的评估算法19
  • 2.1.2 基于URL追踪的评估算法19-20
  • 2.1.3 基于用户联系强度的评估算法20
  • 2.1.4 基于节点相关原则的评估算法20-21
  • 2.2 经典粒子群优化算法21-22
  • 2.2.1 粒子群优化算法简介21-22
  • 2.2.2 相比于其它群体智能优化算法的优势22
  • 2.3 Hadoop平台关键技术22-29
  • 2.3.1 分布式并行化编程模型MapReduce22-26
  • 2.3.2 分布式文件系统HDFS26-27
  • 2.3.3 分布式文件存储系统HBase27-29
  • 2.4 本章小结29-30
  • 第三章 基于PageRank的评估算法URank研究与设计30-40
  • 3.1 PageRank算法分析30-33
  • 3.1.1 PageRank算法基本原理30-32
  • 3.1.2 PageRank算法适用环境32-33
  • 3.2 基于改进PageRank算法的URank算法设计33-36
  • 3.2.1 URank算法设计思想33-34
  • 3.2.2 URank算法设计34-35
  • 3.2.3 URank算法实现35-36
  • 3.3 基于MapReduce的URank算法并行化实现36-38
  • 3.3.1 算法并行设计思想36-37
  • 3.3.2 算法并行化实现37-38
  • 3.4 本章小结38-40
  • 第四章 基于粒子群优化的评估算法PsoRank研究与设计40-48
  • 4.1 粒子群优化算法基本原理40-41
  • 4.2 基于改进粒子群优化算法的PsoRank算法设计41-44
  • 4.2.1 PsoRank算法设计思想41
  • 4.2.2 PsoRank算法设计与实现41-44
  • 4.2.3 对粒子群算法的改进44
  • 4.3 基于MapReduce的PsoRank算法并行化实现44-47
  • 4.3.1 算法并行化设计思想44-45
  • 4.3.2 算法并行化实现45-47
  • 4.4 本章小结47-48
  • 第五章 实验平台搭建与实验结果分析48-67
  • 5.1 实验平台搭建48-51
  • 5.1.1 Hadoop集群搭建流程48-51
  • 5.1.2 HBase数据库系统配置51
  • 5.2 实验数据获取与分析51-53
  • 5.3 实验数据预处理与数据存储53-61
  • 5.3.1 实验数据预处理53-58
  • 5.3.2 实验数据存储58-61
  • 5.4 实验平台性能分析61-62
  • 5.5 实验结果分析62-66
  • 5.6 本章小结66-67
  • 第六章 总结与展望67-69
  • 6.1 总结67-68
  • 6.2 展望68-69
  • 参考文献69-73
  • 致谢73-74
  • 攻读硕士学位期间发表的论文74

【相似文献】

中国期刊全文数据库 前10条

1 李号;张保稳;张京海;杨冰;;一种网络空间实体信用动态评估算法[J];信息安全与通信保密;2014年02期

2 吴同;韩臻;;基于类选的电子证据评估算法[J];北京交通大学学报;2013年05期

3 杨林;陶庆云;全惠云;;求解矩形物体布局问题的分布评估算法[J];湖南师范大学自然科学学报;2007年03期

4 侯碧,

本文编号:498792


资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/498792.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户78ea7***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com