电商商品评价情感分析系统研究
发布时间:2020-11-01 16:57
随着电子商务的飞速发展,网购与我们的日常生活变得越来越密不可分,随着而来的是每天都能产生庞大的商品评价数据,这些评价数据不仅可以帮助消费者买到心仪的商品,也可以为作为商家改善各项服务的参考。正因为如此,对在线商品的评价数据进行情感分析显得尤为有意义。本论文的研究课题是“电商商品评价情感分析系统研究”,研究的主要目是为了利用越来越先进的计算机技术对在线商品中存在的大规模有关物流方面的评价进行情感倾向性分析研究,调查消费者对该店所提供的物流服务所持有的意见和态度。本文先对本课题的选题背景、情感分析的研究意义以及情感分析在国内外的研究现状做了一个简单的介绍,再对情感分析的一般步骤进行了说明。以下几点是本文所涉及到的主要内容:1.对原始的评价数据进行数据去重、数据清洗,得到比较纯净的评价数据。2.对商品评价中涉及到有关物流方面的评价数据进行中文分词。本文先对比较常用的中文分词方法进行了简单介绍,然后根据大多数在线商品评价数据的字数都比较少属于短文本的范畴的这一特性,选取了适用于短文本的特征标记法与特征模板,再利用物流方面特有的专业术语词典,与基于字典树的逆向最大匹配算法相结合,得到适用于在线商品评价中有关物流方面评价数据的中文分词方法。3.对传统的常用于文本分类中的特征选择算法信息增益法进行改进。先通过去除“无用词”降低低频特征的影响,再利用特征项在每个类中的文档频率来改进类间不平衡,通过这两个手段以达到对传统信息增益算法进行改进的目的。4.分别利用支持向量机和朴素贝叶斯分类器对采用改进后的特征选择算法和传统的特征选择算法进行实验。得到的实验结果是:在相同的实验条件下,使用朴素贝叶斯分类器对采用传统信息增益特征选择的算法进行分类实验,经计算得到的F-值为0.8573;而对于采用改进后的信息增益算法来说,它的F-值为:0.8786;同样,采用支持向量机分类器对两种特征选择的方法进行分类实验,得到的结论是传统信息增益的算法计算出的F-值为:0.9002;改进后的信息增益算法的F-值是0.9292。经过实验可得出的结论是:支持向量机的分类效果要比朴素贝叶斯的分类效果要好;改进后的信息增益算法的性能也要比传统的信息增益算法的性能要好。
【学位单位】:江苏科技大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:TP391.1
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 课题来源
1.2 课题研究背景与意义
1.3 国内外研究现状
1.3.1 国外研究现状及发展动态
1.3.2 国内研究现状及发展动态
1.4 研究内容及创新点
1.5 论文组织结构
1.6 本章小结
第2章 情感分析相关技术介绍
2.1 情感分析的定义
2.2 情感分析的流程和阶段
2.2.1 语料阶段
2.2.2 数据预处理阶段
2.2.3 特征标注阶段
2.2.4 特征选择阶段
2.2.5 情感分类阶段
2.3 情感分类评价指标
2.4 本章小结
第3章 改进的中文分词方法
3.1 中文分词的必要性
3.2 中文分词的研究现状
3.3 常用的分词方法
3.3.1 基于词典的分词方法
3.3.2 基于理解的分词方法
3.3.3 基于统计的分词方法
3.4 CRF模型简介
3.4.1 CRF模型概述
3.5 利用CRF进行分词
3.5.1 标记选择
3.5.2 特征模板的选择
3.6 基于字典树的逆向最大匹配算法
3.7 实验结果及分析
3.8 本章小结
第4章 特征选择算法及其优化
4.1 文本特征选择概述
4.1.1 向量空间模型
4.2 常用的特征选择算法
4.2.1 特征增强
2统计'> 4.2.2 χ2统计
4.2.3 文档频率
4.2.4 互信息
4.2.5 信息增益
4.3 信息增益算法的改进
4.4 特征项的权值计算
4.5 本章小结
第5章 情感倾向性分析实验和结果分析
5.1 常用的文本分类算法
5.1.1 K-近邻
5.1.2 朴素贝叶斯分类器
5.1.3 支持向量机
5.2 实验设置及结果分析
5.2.1 实验数据
5.2.2 实验工具和环境
5.2.3 实验流程
5.2.4 实验评价标准
5.2.5 实验结果分析
5.3 本章小结
第6章 总结与展望
6.1 论文工作总结
6.2 研究前景展望
参考文献
攻读硕士学位期间参与的科研项目与发表的论文
致谢
【参考文献】
本文编号:2865824
【学位单位】:江苏科技大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:TP391.1
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 课题来源
1.2 课题研究背景与意义
1.3 国内外研究现状
1.3.1 国外研究现状及发展动态
1.3.2 国内研究现状及发展动态
1.4 研究内容及创新点
1.5 论文组织结构
1.6 本章小结
第2章 情感分析相关技术介绍
2.1 情感分析的定义
2.2 情感分析的流程和阶段
2.2.1 语料阶段
2.2.2 数据预处理阶段
2.2.3 特征标注阶段
2.2.4 特征选择阶段
2.2.5 情感分类阶段
2.3 情感分类评价指标
2.4 本章小结
第3章 改进的中文分词方法
3.1 中文分词的必要性
3.2 中文分词的研究现状
3.3 常用的分词方法
3.3.1 基于词典的分词方法
3.3.2 基于理解的分词方法
3.3.3 基于统计的分词方法
3.4 CRF模型简介
3.4.1 CRF模型概述
3.5 利用CRF进行分词
3.5.1 标记选择
3.5.2 特征模板的选择
3.6 基于字典树的逆向最大匹配算法
3.7 实验结果及分析
3.8 本章小结
第4章 特征选择算法及其优化
4.1 文本特征选择概述
4.1.1 向量空间模型
4.2 常用的特征选择算法
4.2.1 特征增强
2统计'> 4.2.2 χ2统计
4.2.3 文档频率
4.2.4 互信息
4.2.5 信息增益
4.3 信息增益算法的改进
4.4 特征项的权值计算
4.5 本章小结
第5章 情感倾向性分析实验和结果分析
5.1 常用的文本分类算法
5.1.1 K-近邻
5.1.2 朴素贝叶斯分类器
5.1.3 支持向量机
5.2 实验设置及结果分析
5.2.1 实验数据
5.2.2 实验工具和环境
5.2.3 实验流程
5.2.4 实验评价标准
5.2.5 实验结果分析
5.3 本章小结
第6章 总结与展望
6.1 论文工作总结
6.2 研究前景展望
参考文献
攻读硕士学位期间参与的科研项目与发表的论文
致谢
【参考文献】
相关期刊论文 前10条
1 高慧;张涛;王付强;夏彬;;面向舆情发现系统的中文语料分词研究[J];软件导刊;2015年11期
2 肖江;丁星;何荣杰;;基于领域情感词典的中文微博情感分析[J];电子设计工程;2015年12期
3 彭琦;俞春强;;浅析中文分词方法[J];信息通信;2015年03期
4 姜芳;李国和;岳翔;吴卫江;洪云峰;刘智渊;程远;;基于粗分和词性标注的中文分词方法[J];计算机工程与应用;2015年06期
5 梁喜涛;顾磊;;中文分词与词性标注研究[J];计算机技术与发展;2015年02期
6 杨立公;朱俭;汤世平;;文本情感分析综述[J];计算机应用;2013年06期
7 顾佼佼;杨志宏;姜文志;胡文萱;;基于条件随机场的中文分词算法改进[J];信息与电子工程;2012年02期
8 赵妍妍;秦兵;刘挺;;文本情感分析[J];软件学报;2010年08期
9 张紫琼;叶强;李一军;;互联网商品评论情感分析研究综述[J];管理科学学报;2010年06期
10 何赛克;王小捷;董远;张韬政;白雪;;归一化的邻接变化数方法在中文分词中的应用[J];中文信息学报;2010年01期
相关硕士学位论文 前1条
1 张贵林;互联网商品评论信息的情感分析研究[D];东南大学;2016年
本文编号:2865824
本文链接:https://www.wllwen.com/guanlilunwen/wuliuguanlilunwen/2865824.html