基于电子产品领域商品评论的情感分析方法研究和实现
发布时间:2023-07-25 04:08
在产品评论中,现有的情感分类是根据用户评论时自主设置的星级数来分为好评差评。但是每个用户对于星级的把控不同,造成产品评论情感分类存在较大的误差。产品评论是潜在消费者在进行购买产品时,进行决策的一个重要参考内容。当分类与评论星级不匹配时,常常会引起潜在消费者对产品本身的质疑。除此之外,产品评论是商家制定销售战略,提升产品性能和服务质量不可缺少的信息来源。但是一个产品的评论可能达到上万条,人工去分析将耗费大量的人力物力,因此通过计算机对其进行分析就显得至关重要。本文以从京东商城爬取的12000条手机评论作为电子产品的代表来对产品评论进行情感分类,并针对短文本中关键词提取的准确率较低和Tri-Train算法中初始分类器的差异性不稳定以及隐性置信度筛选引入噪声影响分类器性能的问题,对现有的关键词提取技术和Tri-Train算法进行改进。主要工作如下:(1)电子产品文本评论内容偏向口语化和网络化,新词使用比较频繁。但是结巴分词识别新词的能力有限,使结巴分词的结果不是很准确。针对这一问题,本文在从京东爬取的语料数据上,使用互信息和左右熵,获取新词语,并将这些新词加入结巴词库,再用新的结巴词库进行分...
【文章页数】:63 页
【学位级别】:硕士
【文章目录】:
致谢
摘要
ABSTRACT
1 引言
1.1 背景及意义
1.2 研究现状
1.3 研究内容
1.4 论文结构
2 情感分析方法
2.1 文本处理技术
2.1.1 数据获取
2.1.2 文本预处理
2.1.3 文本关键词提取
2.1.4 文本向量表示
2.1.5 文本相似度
2.2 基于情感词典的情感分类
2.2.1 情感词典的创建
2.2.2 基于情感词典的情感分析
2.3 基于机器学习的情感分析
2.3.1 有监督的机器学习情感分类
2.3.2 无监督的机器学习情感分类
2.3.3 半监督的机器学习情感分类
2.3.4 集成学习
2.4 评估方法和指标
2.4.1 评估方法
2.4.2 评估指标
2.5 本章小结
3 基于情感词典和TF-IDF的特征选择方案设计
3.1 基于情感词典和TF-IDF的情感特征词选取方法
3.2 电子产品领域情感词典的创建
3.2.1 领域情感词典的发现
3.2.2 领域新词的发现
3.2.3 搭配词典的构建
3.2.4 程度副词和否定词
3.2.5 电子产品领域情感词典的构建
3.3 本章小结
4 基于改进的Tri-Train的情感分类
4.1 基于协同训练的半监督文本分类方法
4.2 基于Tri-Train的半监督文本分类方法
4.3 改进Tri-Train的半监督分类器设计
4.4 本章小结
5 数值结果及分析
5.1 情感分类器的总体框架
5.2 方案验证及分析
5.2.1 基于情感词典和TF-IDF的关键词选择的试验设计及验证
5.2.2 基于改进协同训练的分类器的试验设计及验证
5.3 本章小结
6 结论
参考文献
作者简历及攻读硕士/博士学位期间取得的研究成果
学位论文数据集
本文编号:3837132
【文章页数】:63 页
【学位级别】:硕士
【文章目录】:
致谢
摘要
ABSTRACT
1 引言
1.1 背景及意义
1.2 研究现状
1.3 研究内容
1.4 论文结构
2 情感分析方法
2.1 文本处理技术
2.1.1 数据获取
2.1.2 文本预处理
2.1.3 文本关键词提取
2.1.4 文本向量表示
2.1.5 文本相似度
2.2 基于情感词典的情感分类
2.2.1 情感词典的创建
2.2.2 基于情感词典的情感分析
2.3 基于机器学习的情感分析
2.3.1 有监督的机器学习情感分类
2.3.2 无监督的机器学习情感分类
2.3.3 半监督的机器学习情感分类
2.3.4 集成学习
2.4 评估方法和指标
2.4.1 评估方法
2.4.2 评估指标
2.5 本章小结
3 基于情感词典和TF-IDF的特征选择方案设计
3.1 基于情感词典和TF-IDF的情感特征词选取方法
3.2 电子产品领域情感词典的创建
3.2.1 领域情感词典的发现
3.2.2 领域新词的发现
3.2.3 搭配词典的构建
3.2.4 程度副词和否定词
3.2.5 电子产品领域情感词典的构建
3.3 本章小结
4 基于改进的Tri-Train的情感分类
4.1 基于协同训练的半监督文本分类方法
4.2 基于Tri-Train的半监督文本分类方法
4.3 改进Tri-Train的半监督分类器设计
4.4 本章小结
5 数值结果及分析
5.1 情感分类器的总体框架
5.2 方案验证及分析
5.2.1 基于情感词典和TF-IDF的关键词选择的试验设计及验证
5.2.2 基于改进协同训练的分类器的试验设计及验证
5.3 本章小结
6 结论
参考文献
作者简历及攻读硕士/博士学位期间取得的研究成果
学位论文数据集
本文编号:3837132
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3837132.html