社交网络在信息推广中的应用研究
发布时间:2023-05-19 22:50
本课题依托于新浪微博,主要研究如何高效地从微博中获取数据,对其中的垃圾信息进行过滤,结合有推广需求的信息数据后构建传播模型并推广到社交网络中最适合的结点,最终达到影响力最大化的目的,对信息数据进行有效地推广。首先,在社交网络数据采集方面,本课题通过调用新浪微博API接口、模拟登录、网页采集器等方法获取微博数据,并进行采集性能对比。最终发现采用API接口及模拟登录两种方法融合的方式能更快速地获取到大量数据。本文通过设计网络爬虫采集数据,并分别针对用户个人信息组成、行为特征、社交关系及微博数据组成进行分析,对垃圾用户及垃圾微博进行过滤。其次,对于信息推广问题,本课题通过对社交网络关系结构、网络群体、网络信息等方面进行分析,构建基于SIR的信息传播模型,将需要进行推广的信息数据与微博中获取到的数据相结合,推广到社交网络中最合适的节点。再次,本课题研究了信息推广中的影响力最大化问题。分别对贪心算法、启发式算法进行研究,通过对贪心爬山近似算法、DegreeDiscount启发式算法进行实验对比,发现贪心爬山近似算法在精度上有优势,而DegreeDiscount算法效率较高。经过对本课题实际问题的...
【文章页数】:66 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 论文研究的背景及意义
1.2 国内外研究现状
1.2.1 在线社交网络研究现状
1.2.2 数据采集研究现状
1.2.3 信息传播技术研究现状
1.2.4 影响力最大化问题研究现状
1.3 课题主要研究工作
1.4 论文组织结构
第二章 相关理论与技术研究
2.1 微博的相关研究
2.1.1 OAuth2.0协议
2.1.2 新浪微博API
2.2 社交网络数据采集
2.2.1 社交网络数据爬取策略
2.2.2 新浪微博数据采集方式
2.2.3 社交网络垃圾信息过滤
2.3 基于经典传染病的传播模型
2.4 信息推广影响力最大化
2.4.1 贪心算法
2.4.2 启发式算法
2.5 中文分词器的相关研究
2.5.1 中文分词技术
2.5.2 中文分词工具
2.6 本章小结
第三章 社交网络数据采集技术研究
3.1 新浪微博数据获取
3.1.1 通过新浪微博API获取数据
3.1.2 通过用户模拟登录获取数据
3.1.3 通过新浪微博手机版获取数据
3.2 新浪微博特征分析
3.2.1 用户特征分析
3.2.2 微博特征分析
3.2.3 基于用户特征与微博特征的用户分类
3.3 微博中垃圾检测
3.3.1 中文分词技术对微博数据的初步处理
3.3.2 用户属性计算
3.3.3 垃圾检测流程
3.4 本章小结
第四章 信息推广相关算法的分析与研究
4.1 贪心算法在信息推广影响力最大化中的研究
4.1.1 算法思想
4.1.2 算法实现
4.2 启发式算法在信息推广影响力最大化中的研究
4.2.1 算法思想
4.2.2 算法实现
4.3 影响力最大化优化算法的设计
4.4 本章小结
第五章 信息推广功能的设计与实现
5.1 总体方案设计
5.1.1 方案设计概述
5.1.2 客户端功能模块设计
5.1.3 服务端接口设计
5.1.4 数据库表结构设计
5.2 服务端接口服务的实现
5.2.1 微博API认证接口实现
5.2.2 模拟登录接口实现
5.2.3 用户信息采集接口实现
5.2.4 垃圾用户过滤接口实现
5.2.5 影响力最大化计算接口实现
5.2.6 信息推广接口实现
5.3 数据采集模块的实现
5.3.1 调用新浪微博API采集数据的实现
5.3.2 垃圾过滤的实现
5.3.3 模拟登录数据采集的实现
5.4 信息推广模块的实现
5.4.1 影响力最大化计算的实现
5.4.2 微博信息推广的实现
5.4.3 推广信息查看的实现
5.5 本章小结
第六章 实验结果分析
6.1 实验环境
6.1.1 实验环境介绍
6.1.2 实验数据来源
6.2 信息推广实验分析
6.2.1 信息推广实验
6.2.2 信息推广结果与分析
6.3 数据采集结果分析
6.3.1 数据采集实验
6.3.2 实验结果对比
6.4 影响力最大化分析
6.4.1 运行效率对比
6.4.2 算法精度对比
6.5 本章小结
第七章 总结与展望
7.1 总结
7.2 展望
参考文献
在学期间的研究成果
致谢
本文编号:3820025
【文章页数】:66 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 论文研究的背景及意义
1.2 国内外研究现状
1.2.1 在线社交网络研究现状
1.2.2 数据采集研究现状
1.2.3 信息传播技术研究现状
1.2.4 影响力最大化问题研究现状
1.3 课题主要研究工作
1.4 论文组织结构
第二章 相关理论与技术研究
2.1 微博的相关研究
2.1.1 OAuth2.0协议
2.1.2 新浪微博API
2.2 社交网络数据采集
2.2.1 社交网络数据爬取策略
2.2.2 新浪微博数据采集方式
2.2.3 社交网络垃圾信息过滤
2.3 基于经典传染病的传播模型
2.4 信息推广影响力最大化
2.4.1 贪心算法
2.4.2 启发式算法
2.5 中文分词器的相关研究
2.5.1 中文分词技术
2.5.2 中文分词工具
2.6 本章小结
第三章 社交网络数据采集技术研究
3.1 新浪微博数据获取
3.1.1 通过新浪微博API获取数据
3.1.2 通过用户模拟登录获取数据
3.1.3 通过新浪微博手机版获取数据
3.2 新浪微博特征分析
3.2.1 用户特征分析
3.2.2 微博特征分析
3.2.3 基于用户特征与微博特征的用户分类
3.3 微博中垃圾检测
3.3.1 中文分词技术对微博数据的初步处理
3.3.2 用户属性计算
3.3.3 垃圾检测流程
3.4 本章小结
第四章 信息推广相关算法的分析与研究
4.1 贪心算法在信息推广影响力最大化中的研究
4.1.1 算法思想
4.1.2 算法实现
4.2 启发式算法在信息推广影响力最大化中的研究
4.2.1 算法思想
4.2.2 算法实现
4.3 影响力最大化优化算法的设计
4.4 本章小结
第五章 信息推广功能的设计与实现
5.1 总体方案设计
5.1.1 方案设计概述
5.1.2 客户端功能模块设计
5.1.3 服务端接口设计
5.1.4 数据库表结构设计
5.2 服务端接口服务的实现
5.2.1 微博API认证接口实现
5.2.2 模拟登录接口实现
5.2.3 用户信息采集接口实现
5.2.4 垃圾用户过滤接口实现
5.2.5 影响力最大化计算接口实现
5.2.6 信息推广接口实现
5.3 数据采集模块的实现
5.3.1 调用新浪微博API采集数据的实现
5.3.2 垃圾过滤的实现
5.3.3 模拟登录数据采集的实现
5.4 信息推广模块的实现
5.4.1 影响力最大化计算的实现
5.4.2 微博信息推广的实现
5.4.3 推广信息查看的实现
5.5 本章小结
第六章 实验结果分析
6.1 实验环境
6.1.1 实验环境介绍
6.1.2 实验数据来源
6.2 信息推广实验分析
6.2.1 信息推广实验
6.2.2 信息推广结果与分析
6.3 数据采集结果分析
6.3.1 数据采集实验
6.3.2 实验结果对比
6.4 影响力最大化分析
6.4.1 运行效率对比
6.4.2 算法精度对比
6.5 本章小结
第七章 总结与展望
7.1 总结
7.2 展望
参考文献
在学期间的研究成果
致谢
本文编号:3820025
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3820025.html