社交网络用户发布模式分析与兴趣预测研究
发布时间:2022-12-23 00:42
数十亿用户通过在社交网络服务上发布照片和文本来分享他们的想法。他们对各种主题感兴趣,通常有不同的情感倾向和发布活动。本文提出一种全新的方法来表征社交网络用户的发布行为,从而将用户的发布行为表示为发布模式的概率分布,而不是单一的类别。作为发布模式分布的应用,将发布模式的分布用于用户兴趣预测。本研究基于Facebook和Twitter,两个受欢迎的社交媒体网站,并构建了Facebook用户和Twitter用户的数据集。本文提出了两个模型:发布模式模型用于表征社交网络用户的发布活动,兴趣预测模型用于社交网络预测用户的兴趣。发布模式模型通过将每个帖子的三个分数(极性,主观性和单词数)编码为一个元组,并构建基于帖子离散元组的LDA模型来发现用户发帖的典型模式模型,将用户的发贴行为表示为发布模式的概率分布。兴趣预测模块通过整合用户的发布模式分布、用户个人资料和帖子特征,并与从用户的喜欢页面中提取的语义特征相结合,构建兴趣预测模型,从而验证发布模式是否提高用户兴趣预测的准确性。兴趣预测实验结果显示,将包含用户发布模式分布的用户行为特征和语言特征结合比仅使用语言特征时模型的性能更好。这表明尽管用户行为...
【文章页数】:74 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
1 绪论
1.1 研究背景及目的
1.2 国内外研究现状
1.2.1 社交网络用户分类研究现状
1.2.2 社交网络用户兴趣预测研究现状
1.3 论文的研究内容与组织结构
1.3.1 论文的研究内容
1.3.2 论文的组织结构
2 相关知识和技术
2.1 社交网络
2.1.1 社交网络概念
2.1.2 社交网络数据
2.2 离散化
2.2.1 离散化的常用术语
2.2.2 离散化过程
2.2.3 离散化结果评估
2.3 LDA主题模型
2.3.1 三层贝叶斯概率模型
2.3.2 LDA生成过程
2.3.3 LDA学习过程
2.4 Xgboost预测模型
2.4.1 Boosting分类器
2.4.2 梯度提升树算法
2.4.3 Xgboost算法
2.5 本章小结
3 数据收集和情感分析
3.1 采集用户
3.2 提取帖子
3.3 情感分析
3.3.1 检验TextBlob极性值的准确性
3.3.2 检验字数对TextBlob估计准确率的影响
3.4 本章小结
4 用户发布模式模型
4.1 帖子的离散元组
4.2 基于离散元组的LDA模型
4.2.1 模型的三层结构
4.2.2 模型的生成过程
4.2.3 模型的训练过程
4.2.4 模型的评估
4.3 用户发布模式分布
4.3.1 标记发布模式
4.3.2 相似用户推荐
4.3.3 用户发布模式可视化
4.4 实验结果
4.4.1 最佳LDA模型
4.4.2 潜在发布模式的标记
4.4.3 相似发布模式的用户
4.4.4 用户发布模式的可视化
4.5 本章小结
5 用户兴趣预测模型
5.1 二元分类模型
5.1.1 分类评估指标
5.1.2 分类算法
5.2 兴趣预测特征
5.3 实验结果与分析
5.3.1 选取发布模式分布特征
5.3.2 兴趣预测模型的性能
5.3.3 相关研究比较
5.4 本章小结
6 总结与展望
6.1 总结
6.2 展望
参考文献
附录 硕士期间研究成果
致谢
本文编号:3724368
【文章页数】:74 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
1 绪论
1.1 研究背景及目的
1.2 国内外研究现状
1.2.1 社交网络用户分类研究现状
1.2.2 社交网络用户兴趣预测研究现状
1.3 论文的研究内容与组织结构
1.3.1 论文的研究内容
1.3.2 论文的组织结构
2 相关知识和技术
2.1 社交网络
2.1.1 社交网络概念
2.1.2 社交网络数据
2.2 离散化
2.2.1 离散化的常用术语
2.2.2 离散化过程
2.2.3 离散化结果评估
2.3 LDA主题模型
2.3.1 三层贝叶斯概率模型
2.3.2 LDA生成过程
2.3.3 LDA学习过程
2.4 Xgboost预测模型
2.4.1 Boosting分类器
2.4.2 梯度提升树算法
2.4.3 Xgboost算法
2.5 本章小结
3 数据收集和情感分析
3.1 采集用户
3.2 提取帖子
3.3 情感分析
3.3.1 检验TextBlob极性值的准确性
3.3.2 检验字数对TextBlob估计准确率的影响
3.4 本章小结
4 用户发布模式模型
4.1 帖子的离散元组
4.2 基于离散元组的LDA模型
4.2.1 模型的三层结构
4.2.2 模型的生成过程
4.2.3 模型的训练过程
4.2.4 模型的评估
4.3 用户发布模式分布
4.3.1 标记发布模式
4.3.2 相似用户推荐
4.3.3 用户发布模式可视化
4.4 实验结果
4.4.1 最佳LDA模型
4.4.2 潜在发布模式的标记
4.4.3 相似发布模式的用户
4.4.4 用户发布模式的可视化
4.5 本章小结
5 用户兴趣预测模型
5.1 二元分类模型
5.1.1 分类评估指标
5.1.2 分类算法
5.2 兴趣预测特征
5.3 实验结果与分析
5.3.1 选取发布模式分布特征
5.3.2 兴趣预测模型的性能
5.3.3 相关研究比较
5.4 本章小结
6 总结与展望
6.1 总结
6.2 展望
参考文献
附录 硕士期间研究成果
致谢
本文编号:3724368
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3724368.html
最近更新
教材专著