基于微博的专家用户搜索关键技术研究
发布时间:2021-06-22 10:19
近年来,随着Web2.0的快速发展,社会网络越来越普及,Twitter和Weibo等微博客被广泛使用,并产生了巨大的社会影响力,改变了人们的生活方式。微博中有数以亿记的用户,用户的身份也各不相同,其中有名人机构,也有草根大众。如何从这些海量的用户中发现与主题相关的专家用户是一件很有挑战的事情。本文以新浪微博平台为基础,通过用户标签数据和用户关注关系数据来挖掘用户的专家属性。本文通过调查统计分析,发现微博用户朋友之间兴趣趋同的特点,提出同质性假设。针对微博用户标签数据缺失、标签数量少、信息含量低等问题,本文提出改进的TF-IDF模型,过滤低信息含量的用户自标签,并基于同质性假设,设计一种标签传播算法来扩展用户的兴趣标签,形成用户的兴趣图谱。通过用户的兴趣图谱,给用户关注关系附上相应语义信息,以此为基础,利用众包的策略来推断话题专家。根据微博网络中的二八原则,即20%的用户产生80%的内容,本文把微博网络中的用户分为核心群体和辅助群体两大部分。在兴趣图谱基础之上,本文根据特定话题构建局部网络,提出基于用户分级的SALSA算法来计算用户的话题影响力,推断用户的专家属性,并根据微博平台固有特点...
【文章来源】:国防科技大学湖南省 211工程院校 985工程院校
【文章页数】:61 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景
1.1.1 社会网络现状
1.1.2 研究热点
1.2 研究意义
1.3 研究现状
1.4 论文主要工作
1.5 论文组织结构
第二章 相关概念
2.1 社会网络
2.1.1 社会网络构成
2.1.2 社会网络的经典理论
2.2 同质性
2.2.1 同质性定义
2.2.2 社会网络中的同质性现象
2.3 专家用户
2.4 本章小结
第三章 微博用户兴趣图谱挖掘
3.1 兴趣图谱
3.1.1 兴趣图谱定义
3.1.2 微博用户标签
3.2 TF-IDF模型
3.2.1 TF-IDF模型介绍
3.2.2 改进的TF-IDF算法实现
3.3 标签传播
3.3.1 标签传播算法
3.3.2 实验设计
3.4 结果分析
3.5 本章小结
第四章 微博用户影响力分析
4.1 引言
4.2 基于Topic sensitive Pagerank的影响力分析
4.2.1 Pagerank算法介绍
4.2.2 Topic sensitive Pagerank算法介绍
4.2.3 算法实现与分析
4.3 基于SALSA的影响力分析
4.4 基于用户分级SALSA的影响力分析
4.4.1 用户分级模型介绍
4.4.2 算法实现与分析
4.4.3 多特征融合模型
4.5 本章小结
第五章 基于微博数据集的实验验证
5.1 数据集描述
5.2 性能评测方法描述
5.2.1 Precision-Recall
5.2.2 P@N
5.2.3 MAP
5.2.4 NDCG
5.3 结果评测
5.3.1 实验环境
5.3.2 评测内容
5.4 本章小结
第六章 总结
6.1 工作总结
6.2 下一步研究方向
致谢
参考文献
作者在学期间取得的学术成果
作者在学期间参加的科研项目
【参考文献】:
期刊论文
[1]复杂网络聚类方法[J]. 杨博,刘大有,金弟,马海宾. 软件学报. 2009(01)
本文编号:3242661
【文章来源】:国防科技大学湖南省 211工程院校 985工程院校
【文章页数】:61 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景
1.1.1 社会网络现状
1.1.2 研究热点
1.2 研究意义
1.3 研究现状
1.4 论文主要工作
1.5 论文组织结构
第二章 相关概念
2.1 社会网络
2.1.1 社会网络构成
2.1.2 社会网络的经典理论
2.2 同质性
2.2.1 同质性定义
2.2.2 社会网络中的同质性现象
2.3 专家用户
2.4 本章小结
第三章 微博用户兴趣图谱挖掘
3.1 兴趣图谱
3.1.1 兴趣图谱定义
3.1.2 微博用户标签
3.2 TF-IDF模型
3.2.1 TF-IDF模型介绍
3.2.2 改进的TF-IDF算法实现
3.3 标签传播
3.3.1 标签传播算法
3.3.2 实验设计
3.4 结果分析
3.5 本章小结
第四章 微博用户影响力分析
4.1 引言
4.2 基于Topic sensitive Pagerank的影响力分析
4.2.1 Pagerank算法介绍
4.2.2 Topic sensitive Pagerank算法介绍
4.2.3 算法实现与分析
4.3 基于SALSA的影响力分析
4.4 基于用户分级SALSA的影响力分析
4.4.1 用户分级模型介绍
4.4.2 算法实现与分析
4.4.3 多特征融合模型
4.5 本章小结
第五章 基于微博数据集的实验验证
5.1 数据集描述
5.2 性能评测方法描述
5.2.1 Precision-Recall
5.2.2 P@N
5.2.3 MAP
5.2.4 NDCG
5.3 结果评测
5.3.1 实验环境
5.3.2 评测内容
5.4 本章小结
第六章 总结
6.1 工作总结
6.2 下一步研究方向
致谢
参考文献
作者在学期间取得的学术成果
作者在学期间参加的科研项目
【参考文献】:
期刊论文
[1]复杂网络聚类方法[J]. 杨博,刘大有,金弟,马海宾. 软件学报. 2009(01)
本文编号:3242661
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3242661.html