基于兴趣转移的微博用户动态画像构建研究
发布时间:2023-06-03 13:19
随着互联网技术的蓬勃发展,以微博、微信等为代表的社交媒体应运而生,并凭借其全民化、多元化、自由参与等独特优势吸引人们的广泛参与。社交媒体用户规模庞大,用户间交互使得社交媒体产生海量数据,这些数据为用户画像生成提供了重要的数据来源。用户画像是建立在用户真实数据之上的用户标签化表示。用户画像对于精准识别用户需求与兴趣具有重要价值,现已被广泛应用于个性化推荐、精准营销等方面。微博作为web2.0时代具有代表性的社交媒体,其用户画像的构建逐渐成为当前研究热点。本文在综合已有用户画像研究的基础上,针对现有微博用户画像构建方法存在的对用户特征提取不全面、不准确的问题,提出基于兴趣转移的微博用户动态画像构建方法。该方法构建的微博用户动态画像包括静态属性标签和动态兴趣标签两部分。静态属性标签从用户微博平台主页的基本信息中提取;动态兴趣标签依据用户历史微博集进行动态的兴趣挖掘。本文主要的研究工作如下:(1)用户静态属性标签的提取:从用户微博主页个人信息中获取用户相关属性信息,包括性别、年龄、地域、学校、公司、个人简介、微博认证以及自勾选标签,对获取的原始文本进行文本处理,运用层次分析法确定标签权重,生成...
【文章页数】:61 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究背景和意义
1.1.1 研究背景
1.1.2 研究意义
1.2 研究现状
1.2.1 用户画像构建的国内外研究现状
1.2.2 微博的用户画像构建研究现状
1.3 创新点与研究方法
1.3.1 研究内容
1.3.2 创新点
1.4 研究方法
1.5 本章小结
第二章 相关工作
2.1 文本预处理
2.1.1 中文分词技术
2.1.2 去停用词
2.2 文本表示
2.2.1 向量空间模型
2.2.2 特征选择——TF-IDF算法
2.2.3 文本相似度计算
2.3 层次分析法
2.4 聚类分析
2.4.1 聚类分析算法分类及分析
2.4.2 K-means 聚类
2.5 生命周期理论
2.5.1 生命周期的内涵
2.5.2 生命周期理论的适用对象
2.5.3 生命周期理论的适用模型
2.6 本章小结
第三章 微博用户动态画像构建
3.1 问题分析与用户画像表示
3.2 基于属性信息的静态属性标签提取
3.2.1 用户属性信息描述
3.2.2 属性标签的提取
3.2.3 权重计算
3.3 基于兴趣转移的动态兴趣标签提取
3.3.1 候选兴趣词集的获取
3.3.2 兴趣转移的时间衰减函数的构造
3.3.3 动态兴趣标签的生成与更新
3.4 本章小结
第四章 实证研究
4.1 实验数据集描述
4.2 评价标准
4.3 实验与分析
4.3.1 相关参数的确定
4.3.2 对比实验
4.4 本章小结
第五章 总结与展望
5.1 总结
5.2 展望
参考文献
致谢
攻读学位期间取得的研究成果
本文编号:3829410
【文章页数】:61 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究背景和意义
1.1.1 研究背景
1.1.2 研究意义
1.2 研究现状
1.2.1 用户画像构建的国内外研究现状
1.2.2 微博的用户画像构建研究现状
1.3 创新点与研究方法
1.3.1 研究内容
1.3.2 创新点
1.4 研究方法
1.5 本章小结
第二章 相关工作
2.1 文本预处理
2.1.1 中文分词技术
2.1.2 去停用词
2.2 文本表示
2.2.1 向量空间模型
2.2.2 特征选择——TF-IDF算法
2.2.3 文本相似度计算
2.3 层次分析法
2.4 聚类分析
2.4.1 聚类分析算法分类及分析
2.4.2 K-means 聚类
2.5 生命周期理论
2.5.1 生命周期的内涵
2.5.2 生命周期理论的适用对象
2.5.3 生命周期理论的适用模型
2.6 本章小结
第三章 微博用户动态画像构建
3.1 问题分析与用户画像表示
3.2 基于属性信息的静态属性标签提取
3.2.1 用户属性信息描述
3.2.2 属性标签的提取
3.2.3 权重计算
3.3 基于兴趣转移的动态兴趣标签提取
3.3.1 候选兴趣词集的获取
3.3.2 兴趣转移的时间衰减函数的构造
3.3.3 动态兴趣标签的生成与更新
3.4 本章小结
第四章 实证研究
4.1 实验数据集描述
4.2 评价标准
4.3 实验与分析
4.3.1 相关参数的确定
4.3.2 对比实验
4.4 本章小结
第五章 总结与展望
5.1 总结
5.2 展望
参考文献
致谢
攻读学位期间取得的研究成果
本文编号:3829410
本文链接:https://www.wllwen.com/tushudanganlunwen/3829410.html