基于GN算法的社会网络舆情分析技术研究
发布时间:2021-01-29 01:28
目前各界对于社会网络舆情的分析备受关注,对于网络舆情分析技术也是多元化的,其中常用的社会网络发现聚类方法有GN算法(Girvan-Newman Algorithm)。GN算法的优点是发现社区的准确度高,算法结构简单,鲁棒性强。但是GN算法仍然存在问题,该算法在发现社区结构时的时间复杂度高,计算效率慢。针对该问题本文提出对现有的GN算法进行并行化改进,以此来提高对社会网络舆情分析时发现社团的速度,使得在实际应用中能够快速准确的发现社团,确定社团结构。本文首先对传统GN算法的计算过程进行分析,发现算法在计算边介数值时是串行进行的,即算法在循环过程中一次只计算网络中一个节点的广度遍历图所生成的节点与边之间的关系结构。该结构为接下来在扫描点到点之间的最短路径时所记录的边介数值提供了先验条件。通过对并行化计算理论的研究与GN算法相结合,得出GN算法的可并行性。其次,建立算法的并行计算模型,描述舆情网络中各个节点之间的关系,分析节点与边的联系,并基于此模型设计出并行化的GN算法。再次,引入Hadoop平台,通过Hadoop下的MapReduce并行机制与算法进行结合,使其在多机的模型下分别计算网络...
【文章来源】:华北水利水电大学河南省
【文章页数】:51 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景
1.2 研究目的和意义
1.3 研究内容
1.4 技术路线
2 社会网络舆情分析理论及相关技术介绍
2.1 社会网络舆情分析概述
2.1.1 社会网络舆情分析技术
2.1.2 社会网络原理
2.1.3 社会网络舆情分析的意义
2.2 社团发现的基本概念
2.2.1 不同的社团类型
2.2.2 分裂的层次聚类技术
2.3 Hadoop概述
2.3.1 Hadoop的整体框架
2.4 NodeXL可视化
2.5 本章小结
3 社会网络舆情分析技术研究
3.1 传统的GN算法
3.2 模块度Q值的计算
3.3 社会网络舆情分析的特征
3.4 基于并行计算的GN算法的社会网络舆情研究
3.4.1 并行计算概述
3.4.2 基于GN算法的社会网络舆情分析
3.4.3 GN算法并行化研究与分析
3.5 本章小结
4 并行化的GN算法及实现
4.1 GN算法的并行设计
4.1.1 按网络中顶点之间的边分割
4.1.2 MapReduce机制与算法的结合
4.2 实验关键步骤
4.2.1 MapReduce机制下的GN算法的改进及应用
4.2.2 数据源的组成及结构
4.2.3 Map类的设计
4.2.4 Reduce类的设计
4.3 本章小结
5 实验结果及结论
5.1 实验室实例分析
5.2 实验结果分析
5.3 本章小结
6 总结与展望
6.1 本文总结
6.2 研究展望
致谢
参考文献
本文编号:3006034
【文章来源】:华北水利水电大学河南省
【文章页数】:51 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景
1.2 研究目的和意义
1.3 研究内容
1.4 技术路线
2 社会网络舆情分析理论及相关技术介绍
2.1 社会网络舆情分析概述
2.1.1 社会网络舆情分析技术
2.1.2 社会网络原理
2.1.3 社会网络舆情分析的意义
2.2 社团发现的基本概念
2.2.1 不同的社团类型
2.2.2 分裂的层次聚类技术
2.3 Hadoop概述
2.3.1 Hadoop的整体框架
2.4 NodeXL可视化
2.5 本章小结
3 社会网络舆情分析技术研究
3.1 传统的GN算法
3.2 模块度Q值的计算
3.3 社会网络舆情分析的特征
3.4 基于并行计算的GN算法的社会网络舆情研究
3.4.1 并行计算概述
3.4.2 基于GN算法的社会网络舆情分析
3.4.3 GN算法并行化研究与分析
3.5 本章小结
4 并行化的GN算法及实现
4.1 GN算法的并行设计
4.1.1 按网络中顶点之间的边分割
4.1.2 MapReduce机制与算法的结合
4.2 实验关键步骤
4.2.1 MapReduce机制下的GN算法的改进及应用
4.2.2 数据源的组成及结构
4.2.3 Map类的设计
4.2.4 Reduce类的设计
4.3 本章小结
5 实验结果及结论
5.1 实验室实例分析
5.2 实验结果分析
5.3 本章小结
6 总结与展望
6.1 本文总结
6.2 研究展望
致谢
参考文献
本文编号:3006034
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3006034.html