基于改良SO-PMI算法的在线评论情感倾向性分析研究
发布时间:2020-06-16 01:58
【摘要】:情感是人类所具有的一种特殊的属性。本文研究的内容就是电子商务环境下用户评论文本中的情感分析。评论可以反映出用户使用商品的感受,用户可以表达赞赏也可以宣泄不满。因此,评论是其他用户购买同产品的一种主要参考。但是由于购物者数量众多且文化水平各异,难以对大量的在线评论准确分类,给用户的浏览造成不便。因此引入情感分析方法从情感倾向性入手,对评论进行分类优化,提高用户通过评论判断产品好坏的效率,以便用户高效准确的确定所需商品。本文以用户购买手机的评论作为研究范例,使用情感分析方法判断评论的情感倾向。第一步构造面向手机领域准确全面的情感词典,使用改良后的SO-PMI算法扩充情感词典,进一步,基于情感词典,对情感词及其他类别的词进行相应的计算,判断出评论的情感倾向性,并对其进行分类。主要研究内容总结如下:(1)基础情感词典合并以及修饰性词典整理。在基于情感词典的情感分析中,由于传统单个情感词典在词汇量、版本等方面的限制,对特定领域评论的情感分析效果较差,因此通过搜集整理,选择了知网情感词典、台湾大学情感词典和清华大学李军中文褒贬义词典进行合并,这样就得到了通用基础情感词典,由于本文的特定对象为手机,还添加了手机相关情感词典。并且搜集整理了修饰性词典,具体包括否定词词典、程度副词词典和关联词词典。(2)情感词典扩充。手机评论中还包含着基础情感词典中未添加的词,影响情感分析的效果,要对含有新词的手机评论进行情感倾向性判断,还需要对情感词典进行扩充。为此,本文使用了改良的SO-PMI算法对情感词典进行了扩充。主要改良工作包括:1.使用TF-IDF算法对基准词的选择进行了优化。2.基于多项式贝叶斯(MultinomiaNB)分类器确定出最佳分类维度,然后使用卡方统计量进行候选情感词的提取。(3)手机在线评论情感分类实验。在综合考虑购物平台数据量、口碑、产品的质量后,选择爬取京东网上商城手机版块的评论数据。在对评论进行去重、格式转换等处理后,就得到了带有标注的评论,然后基于情感词典对其进行分类测试,结果显示情感分类方法能够有效的对手机在线评论进行倾向性分类。用实验证明了基于改良SO-PMI算法的词典扩充方法的有效性,为情感词典的扩充提供了一种新的思路,经过验证分类的查准率、召回率以及F1值达到了较高水平。最后,根据改良SO-PMI算法的评论分类结果,设计了情感倾向程度对比实验进行二次分类,进一步对正向评论和负向评论进行细分,其中情感倾向性最高的正向评论和负向评论分类准确度最高。
【学位授予单位】:东北财经大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:F713.36;TP391.1
【图文】:
逦电子商务在线评论的情感倾向性分析逡逑类,成功的筛选出了情感倾向性最强且所包含信息相对较多的评论,将来可以将这些逡逑评论展示给用户或厂商。逡逑第五章总结和展望。从手机评论数据的获取,到SO-PMI算法的改进工作,三个逡逑个分类对比实验,相关词典的整合等多个方面,对全文进行了总结。逡逑图1为情感分析流程图。逡逑f逦逦逦逦;逦r逦逦-逡逑
3.1手机领域情感词典的构建逡逑基于情感词典的情感倾向性分析的核心就是情感词典的构建,情感词典构建的坏将直接决定分类性能。无论是在国内还是国外,通用的基础词典并不能覆盖大多的专门行业的词汇,基础性词汇对于专业领域的评论文本来说,其分类效果不是很好而且基础性词典的规模和侧重点往往有所区别。目前还没有适用于具体领域的情感典,本章将以手机为研究范例,通过改良SO-PMI算法构建一个适用于手机领域的感词典。逡逑目前常用的中文情感词典有知网情感词典(HowNet),台湾大学情感词(NTUSD),清华大学李军中文褒贬义词典等,构建手机领域的情感词典,需要这些情感词典进行整理、合并、去重、删除等操作,然后合并成基础情感词典,还要添加一些手机领域的情感词,以及网络流行的情感词。另外,山于程度副词会起放大评论情感倾向的作用,否定词会产生逆转在线评论情感倾向的作用,因此还需建其他用以辅助判断情感倾向的词典。最后,鉴于网络评论中存在新词影响情感分效果,提出了一种基于改良S0-PM1算法的词典扩展方法构造扩展情感词词典。如3-1所示,下面将进行具体的介绍。逡逑
【学位授予单位】:东北财经大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:F713.36;TP391.1
【图文】:
逦电子商务在线评论的情感倾向性分析逡逑类,成功的筛选出了情感倾向性最强且所包含信息相对较多的评论,将来可以将这些逡逑评论展示给用户或厂商。逡逑第五章总结和展望。从手机评论数据的获取,到SO-PMI算法的改进工作,三个逡逑个分类对比实验,相关词典的整合等多个方面,对全文进行了总结。逡逑图1为情感分析流程图。逡逑f逦逦逦逦;逦r逦逦-逡逑
3.1手机领域情感词典的构建逡逑基于情感词典的情感倾向性分析的核心就是情感词典的构建,情感词典构建的坏将直接决定分类性能。无论是在国内还是国外,通用的基础词典并不能覆盖大多的专门行业的词汇,基础性词汇对于专业领域的评论文本来说,其分类效果不是很好而且基础性词典的规模和侧重点往往有所区别。目前还没有适用于具体领域的情感典,本章将以手机为研究范例,通过改良SO-PMI算法构建一个适用于手机领域的感词典。逡逑目前常用的中文情感词典有知网情感词典(HowNet),台湾大学情感词(NTUSD),清华大学李军中文褒贬义词典等,构建手机领域的情感词典,需要这些情感词典进行整理、合并、去重、删除等操作,然后合并成基础情感词典,还要添加一些手机领域的情感词,以及网络流行的情感词。另外,山于程度副词会起放大评论情感倾向的作用,否定词会产生逆转在线评论情感倾向的作用,因此还需建其他用以辅助判断情感倾向的词典。最后,鉴于网络评论中存在新词影响情感分效果,提出了一种基于改良S0-PM1算法的词典扩展方法构造扩展情感词词典。如3-1所示,下面将进行具体的介绍。逡逑
【相似文献】
相关期刊论文 前2条
1 杜锐;朱艳辉;田海龙;刘t
本文编号:2715346
本文链接:https://www.wllwen.com/jingjilunwen/guojimaoyilunwen/2715346.html