当前位置:主页 > 科技论文 > 软件论文 >

基于电商在线评论的文本情感倾向性分析

发布时间:2024-05-11 11:52
  随着互联网的普及和移动支付的快速发展,网上购物成为人们生活中不可或缺的一部分,随着商品销量不断增长,同时增长的还有消费者评论。消费者在商品评论系统中留下自己的体验与感受,成为商家了解消费者,消费者了解其他消费者的重要窗口,评论数据分析因此具有非常重要的现实意义。目前关于文本情感倾向性分析的研究大多数基于有标签的数据,基于无标签文本数据的研究较少。本文基于挖掘的电商用户评论数据分别研究了有标签数据和无标签数据的情感倾向性分析方法,并继续对这两类文本做了评论特征分析,研究具有重要的理论和实际意义。本文以京东商城的婴儿奶嘴评论文本数据为研究对象,利用Python分别爬取了有标签的奶嘴评论数据和无标签的奶嘴综合评论数据作为分析语料,对数据进行清洗、分词、去停用词等预处理操作后对文本的情感倾向做了分类。对有标签的数据,本文先采用构建情感词典的方法对其进行情感分类,获得了对应的分类效果,然后运用了三种文本特征提取方法—TF-IDF,Word2vec以及TF-IDF加权的Word2vec训练特征向量,并将三种方法获得的特征向量划分训练集和测试集用以训练随机森林、支持向量机和逻辑回归三种机器学习分类器...

【文章页数】:71 页

【学位级别】:硕士

【部分图文】:

图2.1CBOW和Skip-gram模型的网络结构示意图

图2.1CBOW和Skip-gram模型的网络结构示意图

2文本挖掘与情感分析理论11是位置索引。训练好的CBOW和Skip-gram模型并不用来进行进一步的测试,而是选取此时输入层和隐藏层之间的权重矩阵进行下一步的文本分析。而Skip-gram模型的思路则与CBOW不同,其区别在于,将一个特定词的词向量作为输入,特定词对应的上下文词向....


图2.2随机森林算法流程图

图2.2随机森林算法流程图

重庆理工大学硕士学位论文14决定输入的样本应该属于哪一类,最多决策树选择的那一类就认为是该输入样本的类别,随机森林可以既可以处理属性为离散值的量,如ID3算法,也可以处理属性为连续值的量,如C4.5算法[37]。随机森林的基础模型是决策树模型。决策树(decisiontree)模....


图2.3LDA模型

图2.3LDA模型

重庆理工大学硕士学位论文16Ng,AndrewY.,Jordan[46]于2003年提出,该模型的基本思想是:在一篇文档中可能包含多个主题,意味着一个主题会在多个文档中出现,但出现在每篇文档的概率有所差别。而对每个主题来说,会包含多个关键词,同一个关键词也会在多个主题中出现,但出....


图4.1基于情感词典的文本情感倾向分类混淆矩阵

图4.1基于情感词典的文本情感倾向分类混淆矩阵

4文本情感倾向分类27图4.1基于情感词典的文本情感倾向分类混淆矩阵4.1.2基于机器学习的情感分类(1)特征提取及计算在构建分类器之前,需要把分词转换成计算机可以处理的词向量,本节将采用三种不同的文本特征提取方法对分词文本进行向量化,即TF-IDF方法,Word2vec方法,以....



本文编号:3969912

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3969912.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户42771***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com