基于主题情感混合模型的无监督微博情感分类
发布时间:2022-11-11 22:37
随着互联网的兴起,带动了以微博为主的社交网络平台的快速发展,微博评论文本呈指数型增长,从海量评论文本中挖掘的情感信息在商业策划与社会应用中的价值越来越大,与此同时,依托计算机的无监督微博情感分析技术应运而生。与传统文本情感分析不同的是,微博评论文本在情感表达上有其独特之处,微博评论有一定的字数限制,短文本评论居多且数量规模大,易出现文本语法不规范、频现网络新词等现象。故本文针对微博文本以上特点开展研究,构建一个面向微博文本的领域情感词典,提出一种基于BTM主题模型的无监督微博情感分类模型(W-BSTM)。本文所构建的微博文本领域情感词典包含基础情感词典、网络用语情感词典、表情符号情感词典和领域扩建情感词典四部分。在现有情感词典基础上构建了一个二分类基础情感词典;通过观察与整理构建了针对文本中网络词语和表情符号的情感词典;使用基于HowNet语义计算方法建立微博领域的扩展词典,收集那些在传统文本中无情感倾向在微博文本表述中含情感倾向的词。W-BSTM模型是在BTM模型的基础上增加情感层,融合权重模型,形成无监督的“主题-情感-词汇”三层贝叶斯主题情感混合模型,在保留BTM模型原有优越性的...
【文章页数】:61 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 课题背景与意义
1.2 国内外研究现状
1.2.1 基于情感词典的分析方法
1.2.2 基于机器学习的情感分析方法
1.3 论文的主要研究内容与组织结构
1.3.1 主要研究内容
1.3.2 本文组织结构
1.4 本章小结
第二章 相关关键理论与技术研究
2.1 微博文本情感分类流程
2.2 中文数据预处理技术
2.2.1 中文分词
2.2.2 停用词处理
2.3 主题模型
2.3.1 LDA模型
2.3.2 BTM模型
2.4 主题情感模型
2.5 本章小结
第三章 面向微博文本的情感词典构建
3.1 情感词典相关介绍
3.2 微博情感词典的构建
3.2.1 基础情感词典
3.2.2 网络用语情感词典
3.2.3 表情符号情感词典
3.3 微博情感领域词典扩建
3.4 本章小结
第四章 改进的主题情感混合模型
4.1 权重模型
4.1.1 CV词权重模型
4.1.2 SO-PMI词权重模型
4.1.3 词综合权重模型
4.2 加权主题情感混合模型
4.3 文档情感极性判定
4.4 本章小结
第五章 微博情感分析实验
5.1 实验数据
5.1.1 数据获取
5.1.2 数据预处理
5.2 实验参数及评价指标
5.3 模型对比实验结果与分析
5.4 微博评论情感随机测评
5.5 本章小结
第六章 总结与展望
6.1 总结
6.2 展望
参考文献
学术论文与科研项目
致谢
本文编号:3705875
【文章页数】:61 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 课题背景与意义
1.2 国内外研究现状
1.2.1 基于情感词典的分析方法
1.2.2 基于机器学习的情感分析方法
1.3 论文的主要研究内容与组织结构
1.3.1 主要研究内容
1.3.2 本文组织结构
1.4 本章小结
第二章 相关关键理论与技术研究
2.1 微博文本情感分类流程
2.2 中文数据预处理技术
2.2.1 中文分词
2.2.2 停用词处理
2.3 主题模型
2.3.1 LDA模型
2.3.2 BTM模型
2.4 主题情感模型
2.5 本章小结
第三章 面向微博文本的情感词典构建
3.1 情感词典相关介绍
3.2 微博情感词典的构建
3.2.1 基础情感词典
3.2.2 网络用语情感词典
3.2.3 表情符号情感词典
3.3 微博情感领域词典扩建
3.4 本章小结
第四章 改进的主题情感混合模型
4.1 权重模型
4.1.1 CV词权重模型
4.1.2 SO-PMI词权重模型
4.1.3 词综合权重模型
4.2 加权主题情感混合模型
4.3 文档情感极性判定
4.4 本章小结
第五章 微博情感分析实验
5.1 实验数据
5.1.1 数据获取
5.1.2 数据预处理
5.2 实验参数及评价指标
5.3 模型对比实验结果与分析
5.4 微博评论情感随机测评
5.5 本章小结
第六章 总结与展望
6.1 总结
6.2 展望
参考文献
学术论文与科研项目
致谢
本文编号:3705875
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3705875.html
最近更新
教材专著