基于SVM的电商评论文本情感倾向性分析
发布时间:2021-10-08 08:43
当今世界,电子商务平台飞速发展,海量的用户评论文本也由此产生。这些评论文本中包含了购买者对产品的情感倾向,如:“正向”、“负向”等。研究这些评论文本的情感倾向性,有助于平台管理者了解产品的优势和不足之处,便于日后的产品改进。同时,在获取到评论文本中的情感信息后,潜在的用户更容易做出正确的消费决策。而本文的研究方向是对电商平台的评论文本进行情感倾向性分析,在实验与研究过程中发现了模型构建的向量空间质量不够好,并且在长评论文本与短评论文本数据集上,SVM与MNB算法的表现刚好相反,因此由两个算法单独构建的模型并不具有一般适用性。为了解决这些问题,本文提出了两种改进方法:首先,将语料库及情感词典投入Word2vec模型中,构建两个词向量空间,并将两者进行特征组合;其次改进传统机器学习算法SVM,将其与MNB算法结合,构建分类器。本文的主要内容由以下几个部分组成:首先,本文介绍了文本情感倾向性分析目前的研究现状,对目前主流的文本情感倾向性分析方法做了简要概述,分析了已有的方法的现状及不足,并介绍了常用的文本向量化和文本情感分类的相关方法。其次,本文对Word2vec算法进行了深入研究,提出了基...
【文章来源】:燕山大学河北省
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
中国网民规模和互联网普及率
第 3 章 基于 Word2vec 的特征优化模型这个特征组合,本文提出基于 Word2vec 的特征优化ord2vec 的特征优化算法及处理方法文本数据就是电商平台上,各类商品汇总得到 2000络上 kaggle 数据库中下载的公共数据集,里面包含知,想要正确、全面的评价一个商品,好评或差评的地识别好评与差评,对于商品信息的收集,对于商家此作为改进产品的品质有着至关重要的作用。在文章,即“好评”、和“差评”。实验中的文本数据都是签是已经标注好的类别,则具有一定的公信力,本次“1”代表好评。部分实验样本数据如图 3-4 所示。
图 3-5 部分语料预处理结果图过程是特定语料库的处理过程,对常用语料库的操作也是如本一样的,就不在本节重复叙述。在得到了文本数据预处理的构建就能更好的进行下去了,下面就来介绍本次算法的具具体过程简述计及算法过程,如图 3-6 所示。常用语料库 特定语料库Word2vec常用特征 特定特征相似性不变/升高开始
【参考文献】:
期刊论文
[1]中文评论情感分析方法研究[J]. 余培,行鸿彦,刘刚. 电子测量与仪器学报. 2018(12)
[2]第41次《中国互联网络发展状况统计报告》发布[J]. 中国广播. 2018(03)
[3]基于SVM的高维混合特征短文本情感分类[J]. 王义真,郑啸,后盾,胡昊. 计算机技术与发展. 2018(02)
[4]基于SVM的酒店客户评论情感分析[J]. 石强强,赵应丁,杨红云. 计算机与现代化. 2017(03)
[5]情感倾向分析在舆情监控方面的研究[J]. 王林,李昀泽. 微型机与应用. 2017(05)
[6]基于信息内容的词林词语相似度计算[J]. 彭琦,朱新华,陈意山,孙柳,李飞. 计算机应用研究. 2018(02)
[7]基于改进SVM和HMM的文本信息抽取算法[J]. 孙师尧,妙全兴. 计算机应用与软件. 2015(11)
[8]中文基础情感词词典构建方法研究[J]. 柳位平,朱艳辉,栗春亮,向华政,文志强. 计算机应用. 2009(10)
[9]情感语料库的构建和分析[J]. 徐琳宏,林鸿飞,赵晶. 中文信息学报. 2008(01)
博士论文
[1]基于产品评论的情感分析研究[D]. 李方涛.清华大学 2011
本文编号:3423821
【文章来源】:燕山大学河北省
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
中国网民规模和互联网普及率
第 3 章 基于 Word2vec 的特征优化模型这个特征组合,本文提出基于 Word2vec 的特征优化ord2vec 的特征优化算法及处理方法文本数据就是电商平台上,各类商品汇总得到 2000络上 kaggle 数据库中下载的公共数据集,里面包含知,想要正确、全面的评价一个商品,好评或差评的地识别好评与差评,对于商品信息的收集,对于商家此作为改进产品的品质有着至关重要的作用。在文章,即“好评”、和“差评”。实验中的文本数据都是签是已经标注好的类别,则具有一定的公信力,本次“1”代表好评。部分实验样本数据如图 3-4 所示。
图 3-5 部分语料预处理结果图过程是特定语料库的处理过程,对常用语料库的操作也是如本一样的,就不在本节重复叙述。在得到了文本数据预处理的构建就能更好的进行下去了,下面就来介绍本次算法的具具体过程简述计及算法过程,如图 3-6 所示。常用语料库 特定语料库Word2vec常用特征 特定特征相似性不变/升高开始
【参考文献】:
期刊论文
[1]中文评论情感分析方法研究[J]. 余培,行鸿彦,刘刚. 电子测量与仪器学报. 2018(12)
[2]第41次《中国互联网络发展状况统计报告》发布[J]. 中国广播. 2018(03)
[3]基于SVM的高维混合特征短文本情感分类[J]. 王义真,郑啸,后盾,胡昊. 计算机技术与发展. 2018(02)
[4]基于SVM的酒店客户评论情感分析[J]. 石强强,赵应丁,杨红云. 计算机与现代化. 2017(03)
[5]情感倾向分析在舆情监控方面的研究[J]. 王林,李昀泽. 微型机与应用. 2017(05)
[6]基于信息内容的词林词语相似度计算[J]. 彭琦,朱新华,陈意山,孙柳,李飞. 计算机应用研究. 2018(02)
[7]基于改进SVM和HMM的文本信息抽取算法[J]. 孙师尧,妙全兴. 计算机应用与软件. 2015(11)
[8]中文基础情感词词典构建方法研究[J]. 柳位平,朱艳辉,栗春亮,向华政,文志强. 计算机应用. 2009(10)
[9]情感语料库的构建和分析[J]. 徐琳宏,林鸿飞,赵晶. 中文信息学报. 2008(01)
博士论文
[1]基于产品评论的情感分析研究[D]. 李方涛.清华大学 2011
本文编号:3423821
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3423821.html