当前位置:主页 > 经济论文 > 国际贸易论文 >

电子商务在线评论情感分类方法研究

发布时间:2021-06-29 13:07
  随着电子商务的迅速发展,各个电子商务平台都积累了海量的消费者在线评论数据,这些数据蕴藏着极高的商业价值,分析其内容对商家和消费者都具有重要意义,尤其是自动识别评论内容的褒贬性对其进行情感分类。然而在面对海量评论数据时,仅仅依靠人工处理已无法满足需要,这就使得评论文本内容自动分类技术变得十分重要。本研究将现有的文本分类技术运用到电子商务在线评论文本情感分类问题中,通过实验来对比各种分类方法在解决该问题上的优劣性。研究主要做了以下工作:首先利用网络爬虫技术采集真实的电子商务网站在线评论文本数据和评分数据,对数据做预处理后利用Word2vec工具建立词向量模型,以及建立针对电子商务在线评论文本分类任务的情感词典,并选择合适的特征提取方法进行特征提取,然后分别使用基于词典的分类方法,K近邻、决策树、朴素贝叶斯、支持向量机等基于机器学习的分类方法,以及卷积神经网络、长短期记忆模型等深度学习分类方法,对采集的在线客户评论文本数据进行分类,最后比较各种分类方法的准确率、召回率和F测度指标,从而对比分析各种分类方法的优缺点。实验结果表明,基于情感词典的方法从各指标上都明显不如其他方法,可见虽然该方法实... 

【文章来源】:北京邮电大学北京市 211工程院校 教育部直属院校

【文章页数】:65 页

【学位级别】:硕士

【部分图文】:

电子商务在线评论情感分类方法研究


图1-1论文框架??第一章,绪论

示意图,模型结构,目标函数,霍夫曼树


W(t+1)?——??W(t+2)—??图2-2?CBOW模型结构示意图??CBOW的输入层是由2c个当前词在语料中的上下文向量构成,上下各c个。??投影层是由对输入层向量的算术求和来得到,即;cw=E%W(t?+?c)?-?w(t),可??见投影层不包含任何参数。输出层是以语料中出现过的词为叶子结点,权值为词??语在语料中的频数,构造的一棵霍夫曼树。若一共有n个词出现在语料中,那么??该霍夫曼树就有n个叶子结点,n-1个非叶子结点,并且每个非叶子结点都有一??个参数向量0/。由霍夫曼树得到的目标函数Y表示由;nv和参数向量0/??(j=l,2,3,…,k,k取决于当前词在树中的位置)计算当前词的概率,再由梯度上??升法优化Y,然后更新参数和当前词上下文2c个词的词向量。??16??

流程图,机器学习,流程图,模型训练


1??词语的相似性判断??图4-2?Word2vec词向量模型训练流程图??本研宂使用Python2.7编写程序代码,首先导入原始评论文本数据,对数据??做预处理,得到分词后的数据,这一步己在第二章完成,其次在程序中导入gensim??库,设置模型参数为:向量维度〗〇〇,训练epoch为5,min_count等于1?(词??典词频,表示模型在训练词向量对词典做截断时,少于该参数次数的词会去掉),??window?(表示当前词与预测词在一"句子中的最大距离)等于5,模型采用??CBOW(DBOW),建立初始化参数的Word2Vec模型。将预处理后的语料数据导??入W〇rd2VeC模型进行模型训练,得到训练之后的词向量模型,最后词语相似度??用?model.similarity?来计算。??32??

【参考文献】:
期刊论文
[1]基于词向量的跨领域中文情感词典构建方法[J]. 冯超,梁循,李亚平,周小平,李晓菲.  数据采集与处理. 2017(03)
[2]面向汽车评论的细粒度情感分析方法研究[J]. 陈炳丰,郝志峰,蔡瑞初,温雯,王丽娟,黄浩,蔡晓凤.  广东工业大学学报. 2017(03)
[3]分段卷积神经网络在文本情感分析中的应用[J]. 杜昌顺,黄磊.  计算机工程与科学. 2017(01)
[4]网络用语词典的构建及问题分析[J]. 昝红英,许鸿飞,张坤丽,穗志方.  中文信息学报. 2016(06)
[5]面向产品特征的中文在线评论情感分类:以本体建模为方法[J]. 尹裴,王洪伟.  系统管理学报. 2016(01)
[6]基于卷积神经网络的微博情感倾向性分析[J]. 刘龙飞,杨亮,张绍武,林鸿飞.  中文信息学报. 2015(06)
[7]基于极性转移和LSTM递归网络的情感分析[J]. 梁军,柴玉梅,原慧斌,高明磊,昝红英.  中文信息学报. 2015(05)
[8]基于情感倾向的在线评论对购买决策的影响[J]. 钱瑛,杨定华.  商业研究. 2015(06)
[9]基于极性词典的中文微博客情感分类[J]. 王勇,吕学强,姬连春,肖诗斌.  计算机应用与软件. 2014(01)
[10]微博短文本预处理及学习研究综述[J]. 王连喜.  图书情报工作. 2013(11)

博士论文
[1]面向微博短文本的情感分析研究[D]. 刘楠.武汉大学 2013
[2]在线中文评论情感分类问题研究[D]. 张紫琼.哈尔滨工业大学 2010
[3]基于Web的评论文本情感分类问题研究[D]. 王素格.上海大学 2008

硕士论文
[1]基于上下文观点的微博情感倾向分析研究[D]. 刘承运.山东师范大学 2017
[2]基于深度神经网络的微博短文本情感分析研究[D]. 张英.中原工学院 2017
[3]面向评论文本的多文档情感摘要研究[D]. 李宪毅.山东师范大学 2016
[4]面向汽车在线评论的情感分类研究与应用[D]. 黄鹤.哈尔滨工业大学 2013
[5]中文文本倾向性分类系统研究[D]. 邓忠莹.昆明理工大学 2009



本文编号:3256500

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/guojimaoyilunwen/3256500.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户91dfd***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com