方面级情感分析在商品评论中的研究
发布时间:2024-12-17 23:47
随着网上购物规模的不断扩大,对商品评论信息进行情感分析不仅可以指导消费者做出更好的购买决策,还能帮助商家了解商品的优劣势,从而调整店铺的营销策略,对买卖双方都具有重要的现实意义。本文主要从三个方面对商品评论文本进行研究,方面提取(Aspect extraction)研究、中文词向量模型研究和方面情感分类(Aspect sentiment classification)研究,主要创新成果如下:(1)提出两种特征选择方法和基于层次关系的复杂方面短语提取算法。为了解决中文商品评论缺少合适的领域词典,而且存在多个词语组成的复杂方面短语等问题,本文首先使用HowNet词典,通过计算方面语义相似度和相关度作为方面提取的语义特征。然后为不同种类的商品构建具有层次关系的特征本体和特征情感词集,结合句法依存关系作为句法依存特征,用于方面提取。另外,通过收集和整理商品评论信息,补充实验数据,用于复杂方面短语提取。在方面提取实验中,四种商品评论的平均准确率、召回率和F值分别提高3%、3.7%和3.5%。在复杂方面短语提取的实验中,精确评价和覆盖评价准确率也取得较好表现。(2)提出结合注意机制改进的 RECWE...
【文章页数】:77 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 论文背景及意义
1.2 国内外研究现状
1.2.1 中文商品评论情感分析研究现状
1.2.2 方面级情感分析研究现状
1.2.3 中文词向量研究现状
1.3 主要研究内容
1.4 论文组织结构安排
第二章 方面级情感分析相关理论基础
2.1 文本预处理
2.1.1 清洗
2.1.2 中文分词
2.1.3 停用词过滤
2.2 词向量模型
2.2.1 基于统计方法的词表示
2.2.2 基于语言模型的词向量
2.3 情感分类模型
2.3.1 基于传统机器学习的方法
2.3.2 基于深度学习的方法
2.4 其他相关模型
2.4.1 注意力机制
2.4.2 LDA主题模型
2.4.3 图卷积神经网络(GCN)
2.5 本章小结
第三章 基于层次关系的复杂方面短语提取的研究
3.1 引言
3.2 语义特征
3.2.1 基于义原构造的中文词典HowNet
3.2.2 语义相似度和相关度计算
3.3 基于特征本体和特征情感词的方面提取
3.3.1 构建特征本体和特征情感词
3.3.2 存在不足
3.4 基于层次关系的复杂方面短语提取
3.4.1 句法依存特征提取
3.4.2 基于特征情感词的句法依存特征提取
3.4.3 基于特征本体的句法依存特征提取
3.4.4 特征提取过程
3.5 实验分析
3.5.1 实验数据及实验设置
3.5.2 模型参数调优
3.5.3 实验结果分析
3.6 本章小结
第四章 基于RECWE模型改进的中文词向量方法研究
4.1 引言
4.2 基于RECWE模型的词向量
4.2.1 RECWE模型
4.2.2 模型不足
4.3 基于RECWE模型的中文词向量改进研究
4.4 实验分析
4.4.1 实验数据及实验设置
4.4.2 模型参数调优
4.4.3 实验结果分析
4.5 本章小结
第五章 基于ASGCN模型改进的方面情感分类研究
5.1 引言
5.2 基于ASGCN模型的方面情感分类
5.2.1 ASGCN模型
5.2.2 模型不足
5.3 基于领域识别的DILDA文本主题分布模型
5.3.1 DI LDA模型
5.3.2 方面情感语义词向量
5.4 基于ASGCN的中文商品情感分类改进研究
5.5 实验分析
5.5.1 实验数据及实验设置
5.5.2 模型参数调优
5.5.3 实验结果分析
5.6 本章小结
第六章 总结与展望
6.1 本文研究工作总结
6.2 今后工作展望
参考文献
攻读硕士期间的研究成果
致谢
本文编号:4016717
【文章页数】:77 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 论文背景及意义
1.2 国内外研究现状
1.2.1 中文商品评论情感分析研究现状
1.2.2 方面级情感分析研究现状
1.2.3 中文词向量研究现状
1.3 主要研究内容
1.4 论文组织结构安排
第二章 方面级情感分析相关理论基础
2.1 文本预处理
2.1.1 清洗
2.1.2 中文分词
2.1.3 停用词过滤
2.2 词向量模型
2.2.1 基于统计方法的词表示
2.2.2 基于语言模型的词向量
2.3 情感分类模型
2.3.1 基于传统机器学习的方法
2.3.2 基于深度学习的方法
2.4 其他相关模型
2.4.1 注意力机制
2.4.2 LDA主题模型
2.4.3 图卷积神经网络(GCN)
2.5 本章小结
第三章 基于层次关系的复杂方面短语提取的研究
3.1 引言
3.2 语义特征
3.2.1 基于义原构造的中文词典HowNet
3.2.2 语义相似度和相关度计算
3.3 基于特征本体和特征情感词的方面提取
3.3.1 构建特征本体和特征情感词
3.3.2 存在不足
3.4 基于层次关系的复杂方面短语提取
3.4.1 句法依存特征提取
3.4.2 基于特征情感词的句法依存特征提取
3.4.3 基于特征本体的句法依存特征提取
3.4.4 特征提取过程
3.5 实验分析
3.5.1 实验数据及实验设置
3.5.2 模型参数调优
3.5.3 实验结果分析
3.6 本章小结
第四章 基于RECWE模型改进的中文词向量方法研究
4.1 引言
4.2 基于RECWE模型的词向量
4.2.1 RECWE模型
4.2.2 模型不足
4.3 基于RECWE模型的中文词向量改进研究
4.4 实验分析
4.4.1 实验数据及实验设置
4.4.2 模型参数调优
4.4.3 实验结果分析
4.5 本章小结
第五章 基于ASGCN模型改进的方面情感分类研究
5.1 引言
5.2 基于ASGCN模型的方面情感分类
5.2.1 ASGCN模型
5.2.2 模型不足
5.3 基于领域识别的DILDA文本主题分布模型
5.3.1 DI LDA模型
5.3.2 方面情感语义词向量
5.4 基于ASGCN的中文商品情感分类改进研究
5.5 实验分析
5.5.1 实验数据及实验设置
5.5.2 模型参数调优
5.5.3 实验结果分析
5.6 本章小结
第六章 总结与展望
6.1 本文研究工作总结
6.2 今后工作展望
参考文献
攻读硕士期间的研究成果
致谢
本文编号:4016717
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/4016717.html
最近更新
教材专著