基于主题的文本细粒度情感分析与应用
发布时间:2021-05-26 19:20
基于主题的文本情感分析技术逐渐成为人们关注的热点,其主要任务是通过挖掘用户评论所蕴含的主题、以及对这些主题的情感偏好。本文中的情感倾向包含三级:满意、中立以及不满。区别于传统情感分析和方面级情感分析,“细粒度”体现为在一段评论中,以多个<主题词,情感词,情感倾向>三元组作为结果呈现,并非一段文本只有一个情感;除此之外,主题词不再是“方面”级别,而是随机性更强的任意词语。本文基于真实的互联网商品评论数据,采用模型融合思想,提出了一套包含主题词与情感词抽取、主题词与情感匹配以及主题情感分析的算法框架,在交叉验证的条件下使用标准的F1-Score评判指标取得稳定且显著的效果。本文的主要工作如下三个方面:(1)主题词与情感词抽取方面,将双向长短时记忆网络联合条件随机场作为算法框架;受词嵌入思想的启发,提出主题词与情感词词典嵌入向量方法(Dict Embedding),使召回率以及精确率均取得显著提升。(2)主题词与情感词的匹配策略方面,提出分层匹配策略。分层匹配策略包括两个阶段:在R(Recall)阶段先对所有<主题词-情感词>进行“粗选”,提高召回率;在P(Preci...
【文章来源】:北京邮电大学北京市 211工程院校 教育部直属院校
【文章页数】:66 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景
1.2 研究内容及意义
1.3 国内外研究现状
1.4 论文结构安排
第二章 课题相关理论和技术
2.1 文本预处理
2.2 词向量模型
2.2.1 传统模型
2.2.2 Word2Vector模型
2.2.3 Glove模型
2.3 传统机器学习方法
2.3.1 隐马尔可夫模型HMM
2.3.2 条件随机场CRF
2.3.3 支持向量机SVM
2.4 深度学习方法
2.4.1 卷积神经网络CNN
2.4.2 双向长短期记忆网络BI-LSTM
2.5 序列标注中的标签方案
2.6 本章小结
第三章 基于词典嵌入的深度学习抽取方法
3.1 算法框架
3.2 模型及相关方法
3.2.1 字抽取模型和词抽取模型
3.2.2 词典嵌入向量
3.2.3 分词置信度
3.3 实验与结果分析
3.3.1 数据集与词向量
3.3.2 主题词与情感词抽取实验
3.4 本章小结
第四章 分层匹配策略与联合情感分析方法
4.1 算法框架
4.2 分层匹配策略
4.2.1 常见匹配策略
4.2.2 分层匹配策略
4.3 联合情感分析技术
4.3.1 情感分析框架
4.3.2 基于语境的特征工程
4.4 实验与结果分析
4.4.1 数据集与评价指标
4.4.2 匹配策略实验与结果分析
4.4.3 基于主题的细粒度情感分析实验与结果分析
4.5 本章小结
第五章 总结和展望
5.1 本文工作总结
5.2 未来研究方向
参考文献
致谢
攻读学位期间取得的研究成果
【参考文献】:
期刊论文
[1]无指导的中文开放式实体关系抽取[J]. 秦兵,刘安安,刘挺. 计算机研究与发展. 2015(05)
[2]基于种子自扩展的命名实体关系抽取方法[J]. 何婷婷,徐超,李晶,赵君喆. 计算机工程. 2006(21)
硕士论文
[1]移动流量中基于用户访问序列的表示学习及其应用[D]. 江万.北京邮电大学 2018
[2]面向用户在线评论的情感倾向分析[D]. 刘菲菲.北京邮电大学 2018
[3]基于领域知识库的简历信息抽取系统的设计与实现[D]. 张博.北京邮电大学 2018
[4]面向移动应用商店的智能信息采集系统的研究与实现[D]. 汪鹭.北京邮电大学 2018
[5]基于深度神经网络的方面级情感分析算法研究[D]. 王毅.北京邮电大学 2018
[6]面向产品评论的细粒度情感分析[D]. 李盛秋.哈尔滨工业大学 2017
[7]基于股票评论的句子级情感分析方法研究[D]. 卢琰琰.哈尔滨工业大学 2017
[8]HMM在中文评价挖掘中的研究与应用[D]. 王磊.电子科技大学 2017
[9]基于doc2vec和SVM的舆情情感分析系统的研究与设计[D]. 甘如饴.北京邮电大学 2017
[10]基于CRF的命名实体和关系的联合抽取[D]. 徐秋妍.上海交通大学 2012
本文编号:3206925
【文章来源】:北京邮电大学北京市 211工程院校 教育部直属院校
【文章页数】:66 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景
1.2 研究内容及意义
1.3 国内外研究现状
1.4 论文结构安排
第二章 课题相关理论和技术
2.1 文本预处理
2.2 词向量模型
2.2.1 传统模型
2.2.2 Word2Vector模型
2.2.3 Glove模型
2.3 传统机器学习方法
2.3.1 隐马尔可夫模型HMM
2.3.2 条件随机场CRF
2.3.3 支持向量机SVM
2.4 深度学习方法
2.4.1 卷积神经网络CNN
2.4.2 双向长短期记忆网络BI-LSTM
2.5 序列标注中的标签方案
2.6 本章小结
第三章 基于词典嵌入的深度学习抽取方法
3.1 算法框架
3.2 模型及相关方法
3.2.1 字抽取模型和词抽取模型
3.2.2 词典嵌入向量
3.2.3 分词置信度
3.3 实验与结果分析
3.3.1 数据集与词向量
3.3.2 主题词与情感词抽取实验
3.4 本章小结
第四章 分层匹配策略与联合情感分析方法
4.1 算法框架
4.2 分层匹配策略
4.2.1 常见匹配策略
4.2.2 分层匹配策略
4.3 联合情感分析技术
4.3.1 情感分析框架
4.3.2 基于语境的特征工程
4.4 实验与结果分析
4.4.1 数据集与评价指标
4.4.2 匹配策略实验与结果分析
4.4.3 基于主题的细粒度情感分析实验与结果分析
4.5 本章小结
第五章 总结和展望
5.1 本文工作总结
5.2 未来研究方向
参考文献
致谢
攻读学位期间取得的研究成果
【参考文献】:
期刊论文
[1]无指导的中文开放式实体关系抽取[J]. 秦兵,刘安安,刘挺. 计算机研究与发展. 2015(05)
[2]基于种子自扩展的命名实体关系抽取方法[J]. 何婷婷,徐超,李晶,赵君喆. 计算机工程. 2006(21)
硕士论文
[1]移动流量中基于用户访问序列的表示学习及其应用[D]. 江万.北京邮电大学 2018
[2]面向用户在线评论的情感倾向分析[D]. 刘菲菲.北京邮电大学 2018
[3]基于领域知识库的简历信息抽取系统的设计与实现[D]. 张博.北京邮电大学 2018
[4]面向移动应用商店的智能信息采集系统的研究与实现[D]. 汪鹭.北京邮电大学 2018
[5]基于深度神经网络的方面级情感分析算法研究[D]. 王毅.北京邮电大学 2018
[6]面向产品评论的细粒度情感分析[D]. 李盛秋.哈尔滨工业大学 2017
[7]基于股票评论的句子级情感分析方法研究[D]. 卢琰琰.哈尔滨工业大学 2017
[8]HMM在中文评价挖掘中的研究与应用[D]. 王磊.电子科技大学 2017
[9]基于doc2vec和SVM的舆情情感分析系统的研究与设计[D]. 甘如饴.北京邮电大学 2017
[10]基于CRF的命名实体和关系的联合抽取[D]. 徐秋妍.上海交通大学 2012
本文编号:3206925
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3206925.html
最近更新
教材专著