基于微博转发的特征分析与预测研究
发布时间:2023-04-02 14:32
随着互联网技术的飞速发展,越来越多的网民倾向于在社交平台如Facebook、新浪微博、腾讯微博和人人网等上建立自己的交际圈。在微博中,当某个用户发布了一篇微博帖子,其它用户可能转发他的帖子,这个转发过程就会使得信息的快速传播与扩散。有益的信息能给社会带来积极的影响,不良的信息则会造成病毒式传播,最后导致舆情的产生,给社会带来危害。研究微博用户转发行为,分析其传播规律,可以提前预测某条微博传播结果,这对研究网络舆情、广告投放、商业决策等具有重要意义。通过对微博用户在社交网络中的转发行为规律研究和分析,本文提出了全面又新奇的方法,其中包括影响微博转发的特征体系构建、基于Filter和Wrapper的特征筛选模型和基于集成学习的微博转发预测模型。针对主流方法考虑的转发因素比较单一的缺点,本文提出了影响微博转发的特征体系构建方法。考虑到用户的兴趣随着时间是不断变化的,针对这一问题,本文提出了基于兴趣漂移的LDA主题模型;考虑到地理位置与用户转发行为存在密切关系,本文提出了基于地理位置相似度;在以往的研究中,研究者很少考虑用户间的网络结构和用户交互行为,本文提出了用户聚集系数特征、用户间邻里重叠...
【文章页数】:70 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景和意义
1.2 国内外研究现状
1.2.1 关于影响转发行为因素的研究
1.2.2 关于社交网络的转发行为研究
1.2.3 关于信息传播的研究
1.2.4 本章小结
1.3 本文主要研究内容
1.4 本文的结构安排
2 相关背景知识
2.1 文本处理技术
2.1.1 汉语分词
2.1.2 去停用词
2.1.3 文本表示
2.2 特征筛选
2.3 机器学习方法
2.3.1 逻辑斯谛回归
2.3.2 集成学习
3 影响微博转发的特征体系
3.1 用户转发行为定义和分析
3.2 用户特征
3.2.1 微博用户是否认证
3.2.2 微博用户性别是否相同
3.2.3 用户间命名实体相似度
3.2.4 地理位置相似度
3.3 微博特征
3.3.1 微博帖子是否含话题标签(#hashtag)
3.3.2 微博帖子是否含URL
3.3.3 基于兴趣漂移的主题相似度
3.3.4 TF-IDF空间向量相似度
3.4 网络结构特征
3.4.1 用户聚集系数
3.4.2 用户间的邻里重叠度
3.4.3 用户影响力
3.4.4 网络局部结构影响力
3.5 交互行为特征
3.5.1 用户间是否互为好友
3.5.2 用户是否提及(@)对方
3.5.3 用户是否评论对方
3.5.4 用户的转发影响力
3.5.5 下游用户转发活跃度
3.6 特征值归一化处理
3.7 指标体系的构建
4 基于Filter和Wrapper的特征筛选模型
4.1 Filter单一因素检验
4.1.1 方差分析
4.1.2 卡方检验
4.1.3 点二列相关性分析
4.2 Wrapper多因素检验
5 微博用户转发预测模型构建
6 实验
6.1 实验准备
6.1.1 实验环境
6.1.2 实验数据
6.1.3 实验指标
6.2 特征分析
6.2.1 方差分析
6.2.2 卡方检验
6.2.3 点二列相关性分析
6.2.4 LVW特征组合分析
6.3 基于多特征的Adaboost预测模型
总结与展望
参考文献
攻读硕士学位期间发表论文及科研成果
致谢
本文编号:3779391
【文章页数】:70 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景和意义
1.2 国内外研究现状
1.2.1 关于影响转发行为因素的研究
1.2.2 关于社交网络的转发行为研究
1.2.3 关于信息传播的研究
1.2.4 本章小结
1.3 本文主要研究内容
1.4 本文的结构安排
2 相关背景知识
2.1 文本处理技术
2.1.1 汉语分词
2.1.2 去停用词
2.1.3 文本表示
2.2 特征筛选
2.3 机器学习方法
2.3.1 逻辑斯谛回归
2.3.2 集成学习
3 影响微博转发的特征体系
3.1 用户转发行为定义和分析
3.2 用户特征
3.2.1 微博用户是否认证
3.2.2 微博用户性别是否相同
3.2.3 用户间命名实体相似度
3.2.4 地理位置相似度
3.3 微博特征
3.3.1 微博帖子是否含话题标签(#hashtag)
3.3.2 微博帖子是否含URL
3.3.3 基于兴趣漂移的主题相似度
3.3.4 TF-IDF空间向量相似度
3.4 网络结构特征
3.4.1 用户聚集系数
3.4.2 用户间的邻里重叠度
3.4.3 用户影响力
3.4.4 网络局部结构影响力
3.5 交互行为特征
3.5.1 用户间是否互为好友
3.5.2 用户是否提及(@)对方
3.5.3 用户是否评论对方
3.5.4 用户的转发影响力
3.5.5 下游用户转发活跃度
3.6 特征值归一化处理
3.7 指标体系的构建
4 基于Filter和Wrapper的特征筛选模型
4.1 Filter单一因素检验
4.1.1 方差分析
4.1.2 卡方检验
4.1.3 点二列相关性分析
4.2 Wrapper多因素检验
5 微博用户转发预测模型构建
6 实验
6.1 实验准备
6.1.1 实验环境
6.1.2 实验数据
6.1.3 实验指标
6.2 特征分析
6.2.1 方差分析
6.2.2 卡方检验
6.2.3 点二列相关性分析
6.2.4 LVW特征组合分析
6.3 基于多特征的Adaboost预测模型
总结与展望
参考文献
攻读硕士学位期间发表论文及科研成果
致谢
本文编号:3779391
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3779391.html