基于社交网络结构和内容的层次观点挖掘
发布时间:2022-02-05 03:42
社交媒体的迅猛发展为用户提供了更为丰富的表达观点的方式,例如写评论、发表情等,这些文本数据混杂着关注、点赞、转发等行为数据,对现有的观点挖掘方法提出了挑战。考虑到社交媒体数据具有以下特性:(1)用户持有多粒度的观点;(2)用户感兴趣的主题更大程度上影响用户的观点;(3)社交网络结构上有联系的用户之间可能共享相同的观点;(4)用户的观点可能随时间变化,本文围绕基于结构和内容的层次观点挖掘展开研究。论文的主要工作包括如下:1)考虑到微博文本观点的多粒度特性,我们提出了基于概率图模型的层次观点挖掘方法(Hierarchical Opinion Phase,HOP)。与传统的层次主题模型不同,HOP假设对于某一主题只持有支持或者反对立场,这样HOP模型在根节点只有两个分支。同时为了更好地表示观点,我们引入了短语(Phrase)的概念。为了进一步提高层次观点挖掘的准确性,我们引入了哈希标签和情感词字典作为先验。HOP模型在我们爬取的两个分别关于“英国脱欧”和“美国大选”热点主题的微博数据集上实验,结果表明,HOP能够准确地挖掘出层次观点,在文本级别的立场分类上也能取得了不错的性能。2)考虑到用户...
【文章来源】:东南大学江苏省211工程院校985工程院校教育部直属院校
【文章页数】:72 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.2.1 粗粒度观点挖掘
1.2.2 细粒度观点挖掘
1.2.3 层次主题发现
1.3 现有模型的局限性
1.4 本文的研究动机
1.5 本文的主要贡献
1.6 文章结构
第二章 相关算法介绍
2.1 LDA主题模型
2.1.1 生成式过程
2.1.2 基于吉布斯采样的参数估计
2.2 HLDA层次主题模型
2.2.1 生成式过程
2.2.2 嵌套中餐馆过程
2.2.3 后验概率估计
2.3 TPM主题短语模型
2.3.1 生成式过程
2.3.2 Hierarchical Pitman-Yor Process(HPYP)
2.3.3 后验概率估计
2.4 本章小结
第三章 基于社交媒体文本的层次观点挖掘方法
3.1 动机
3.2 层次观点短语模型
3.2.1 生成式过程
3.2.2 基于吉布斯采样的后验概率估计
3.3 实验和结果
3.3.1 数据集构建
3.3.2 基准模型
3.3.3 主题凝聚度
3.3.4 立场分类
3.3.5 定性分析
3.4 本章小结
第四章 基于结构和内容的动态观点预测方法
4.1 动机
4.2 相关工作
4.2.1 融合结构和内容的立场检测
4.2.2 动态观点检测
4.3 动态观点神经网络模型
4.3.1 总体架构
4.3.2 微博表示
4.3.3 获得主题向量
4.3.4 语境注意力机制
4.3.5 流数据上的用户级别立场检测
4.3.6 模型的変种
4.4 实验和结果
4.4.1 实验设定
4.4.2 实验结果
4.5 本章小结
第五章 总结和展望
5.1 文章总结
5.2 工作展望
致谢
参考文献
作者简介
【参考文献】:
期刊论文
[1]基于主题模型的微博转发行为预测[J]. 郭亚,宫叶云,张奇,黄萱菁. 中文信息学报. 2018(04)
[2]文本情感分析[J]. 赵妍妍,秦兵,刘挺. 软件学报. 2010(08)
[3]产品评论挖掘研究综述[J]. 伍星,何中市,黄永文. 计算机工程与应用. 2008(36)
本文编号:3614495
【文章来源】:东南大学江苏省211工程院校985工程院校教育部直属院校
【文章页数】:72 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.2.1 粗粒度观点挖掘
1.2.2 细粒度观点挖掘
1.2.3 层次主题发现
1.3 现有模型的局限性
1.4 本文的研究动机
1.5 本文的主要贡献
1.6 文章结构
第二章 相关算法介绍
2.1 LDA主题模型
2.1.1 生成式过程
2.1.2 基于吉布斯采样的参数估计
2.2 HLDA层次主题模型
2.2.1 生成式过程
2.2.2 嵌套中餐馆过程
2.2.3 后验概率估计
2.3 TPM主题短语模型
2.3.1 生成式过程
2.3.2 Hierarchical Pitman-Yor Process(HPYP)
2.3.3 后验概率估计
2.4 本章小结
第三章 基于社交媒体文本的层次观点挖掘方法
3.1 动机
3.2 层次观点短语模型
3.2.1 生成式过程
3.2.2 基于吉布斯采样的后验概率估计
3.3 实验和结果
3.3.1 数据集构建
3.3.2 基准模型
3.3.3 主题凝聚度
3.3.4 立场分类
3.3.5 定性分析
3.4 本章小结
第四章 基于结构和内容的动态观点预测方法
4.1 动机
4.2 相关工作
4.2.1 融合结构和内容的立场检测
4.2.2 动态观点检测
4.3 动态观点神经网络模型
4.3.1 总体架构
4.3.2 微博表示
4.3.3 获得主题向量
4.3.4 语境注意力机制
4.3.5 流数据上的用户级别立场检测
4.3.6 模型的変种
4.4 实验和结果
4.4.1 实验设定
4.4.2 实验结果
4.5 本章小结
第五章 总结和展望
5.1 文章总结
5.2 工作展望
致谢
参考文献
作者简介
【参考文献】:
期刊论文
[1]基于主题模型的微博转发行为预测[J]. 郭亚,宫叶云,张奇,黄萱菁. 中文信息学报. 2018(04)
[2]文本情感分析[J]. 赵妍妍,秦兵,刘挺. 软件学报. 2010(08)
[3]产品评论挖掘研究综述[J]. 伍星,何中市,黄永文. 计算机工程与应用. 2008(36)
本文编号:3614495
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3614495.html