电商评论文本中的用户情感倾向判定与主题分析
发布时间:2024-02-29 21:18
目前,随着互联网的发展,网络购物已经成为了大多数人购买物品的消费方式,很多人都会在平台上留下对购买物品的看法,留下的这些评论无论是对后续购买者还是厂商都提供了很重要的参考。在此期间,受到大数据、人工智能的影响,智能音箱得到了快速的发展,不仅仅是因为它已经渐渐成为了很多智能设备的控制入口,还有就是它的简单易用、功能多样,但是,如何从数以万计的评论数据中选择合适的音箱是很多人面临的问题,通过对这些评论的分析,不仅仅是对消费者的选择有所帮助,还有可以对厂商的更新换代提供数据上的支持。本文选择的数据是小爱音箱、天猫精灵、小度音箱的评论数据,因为这几款品牌的数据是很有代表性的,所以通过对它们的分析可以为市场上大部分人群提供可行的意见。首先是通过八爪鱼采集器进行数据的采集,在天猫和京东上采集天猫精灵、小爱音箱和小度音箱的数据,然后对这些数据进行预处理,因为经过数据预处理的数据还是非结构性的,这样是不能被计算机识别的,所以这一步最终想要达成的目标是将这些非结构性的数据转化为结构性的,从而能够被计算机识别、分析。在情感分析中,因为机器学习的分类方法一般是需要有标签的数据的,所以本文首先通过基于词典的方...
【文章页数】:52 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景及意义
1.1.1 研究背景
1.1.2 研究意义
1.2 国内外研究现状
1.2.1 情感倾向性分析研究现状
1.2.2 主题模型研究现状
1.2.3 电商评论研究现状
1.3 研究内容及框架
2 研究方法及理论
2.1 文本挖掘
2.1.1 文本挖掘理论
2.1.2 文本预处理
2.1.3 文本的表示
2.1.4 特征的提取
2.2 情感倾向分析
2.3 机器学习算法
2.3.1 支持向量机
2.3.2 K近邻算法
2.3.3 朴素贝叶斯
2.4 LDA主题模型
3 数据采集与预处理
3.1 数据的选取与采集
3.1.1 数据的选取
3.1.2 数据的采集
3.2 数据的预处理
3.2.1 数据的清洗
3.2.2 中文分词与去停用词
3.2.3 词频统计
3.3 本章小结
4 评论数据的情感倾向分析
4.1 基于词典的情感分类
4.1.1 基础词典的构建
4.1.2 否定词典
4.1.3 情感分类结果
4.2 基于机器学习的分类
4.2.1 算法流程
4.2.2 实验步骤
4.2.3 分类器性能评估
4.3 本章小结
5 消费者评论特征分析
5.1 基于词云图的可视化
5.2 基于LDA主题模型的特征分析
5.2.1 LDA最优主题个数的确定
5.2.2 天猫精灵的负面主题分析
5.2.3 小爱音箱的负面主题分析
5.2.4 小度音箱的负面主题分析
5.3 本章小结
6 总结与展望
6.1 论文总结
6.2 不足与展望
参考文献
后记
本文编号:3914937
【文章页数】:52 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景及意义
1.1.1 研究背景
1.1.2 研究意义
1.2 国内外研究现状
1.2.1 情感倾向性分析研究现状
1.2.2 主题模型研究现状
1.2.3 电商评论研究现状
1.3 研究内容及框架
2 研究方法及理论
2.1 文本挖掘
2.1.1 文本挖掘理论
2.1.2 文本预处理
2.1.3 文本的表示
2.1.4 特征的提取
2.2 情感倾向分析
2.3 机器学习算法
2.3.1 支持向量机
2.3.2 K近邻算法
2.3.3 朴素贝叶斯
2.4 LDA主题模型
3 数据采集与预处理
3.1 数据的选取与采集
3.1.1 数据的选取
3.1.2 数据的采集
3.2 数据的预处理
3.2.1 数据的清洗
3.2.2 中文分词与去停用词
3.2.3 词频统计
3.3 本章小结
4 评论数据的情感倾向分析
4.1 基于词典的情感分类
4.1.1 基础词典的构建
4.1.2 否定词典
4.1.3 情感分类结果
4.2 基于机器学习的分类
4.2.1 算法流程
4.2.2 实验步骤
4.2.3 分类器性能评估
4.3 本章小结
5 消费者评论特征分析
5.1 基于词云图的可视化
5.2 基于LDA主题模型的特征分析
5.2.1 LDA最优主题个数的确定
5.2.2 天猫精灵的负面主题分析
5.2.3 小爱音箱的负面主题分析
5.2.4 小度音箱的负面主题分析
5.3 本章小结
6 总结与展望
6.1 论文总结
6.2 不足与展望
参考文献
后记
本文编号:3914937
本文链接:https://www.wllwen.com/qiyeguanlilunwen/3914937.html