当前位置:主页 > 经济论文 > 电子商务论文 >

基于电子商务的评论文本情感极性等级分析

发布时间:2017-03-28 16:05

  本文关键词:基于电子商务的评论文本情感极性等级分析,由笔耕文化传播整理发布。


【摘要】:文本情感分析指研究分析人们对产品、服务、组织机构、事件和话题等进行评价时表达的意见、情感、评价、态度和情绪的特殊自然语言处理研究领域。涉及到多项具有挑战性研究任务,根据研究任务的不同,文本情感分析可以分为情感分类、情感信息抽取、情感信息检索和归纳。研究的过程包括预处理、情感信息抽取、分类器选择、结果归纳展示。 随着web2.0的发展,人们可以通过互联网随时随地发表自己的观点,如博客、论坛、门户网站、电子商务平台等,这些文本能直接或间接反映人的行为和思想,所以研究分析这些文本的情感有许多的用处。关注分析电子商务领域的评论文本情感,无论对消费者还是商家都有重要的意义。目前文本情感分析虽然取得了较大发展,但对情感极性等级分析研究还不足。文本情感存在固有模糊特性,由此可以利用模糊理论的隶属度函数,进行情感极性等级计算。 情感分析主要判断评论文本的情感极性和极性等级,即属于褒义、贬义的强度。根据电子商务领域评论文本的特点,,在已有传统情感分析的基础上,开展对评论句子的情感极性等级分析。首先,通过STEP算法标注WordNet词典中的形容词情感,再用NOS隶属度函数计算词语情感极性等级,构建NOS情感词典。其次,利用整数线性规划(ILP)改造NOS情感词典,得到领域情感词典,使词典最大化适应电子商务领域文本分析。然后,改进传统的加权统计算法,即预先使用投票选举法判断句子极性,再计算情感极性等级,通过与未选举法的极性等级求平均值,作为最终的句子极性值。最后,使用领域情感词典抽取文本中的情感信息,包括情感词典、否定词、程度副词,实现了一个面向电子商务领域的情感分类系统。 实验语料库为12000条评论句子,分别来自家电、酒店、图书类电商网站,通过手工标注语料的褒贬极性作为检验实验结果的金标准。实验结果显示:领域情感词典比NOS词典平均准确率提高了2.7%~6.1%;改进算法比加权统计算法提高了5.7%~9.1%,这说明对情感分析进行的初步尝试有较好效果。
【关键词】:文本情感分析 领域情感词典 模糊理论 整数规划 极性等级计算
【学位授予单位】:重庆交通大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.1
【目录】:
  • 摘要4-5
  • ABSTRACT5-9
  • 第一章 绪论9-18
  • 1.1 研究背景9-11
  • 1.2 国内外研究现状11-13
  • 1.3 研究的目的和意义13-14
  • 1.4 研究中的困难与不足14-16
  • 1.4.1 研究中的困难14-15
  • 1.4.2 发展中的不足15-16
  • 1.5 研究内容及组织结构16-18
  • 1.5.1 主要研究内容16-17
  • 1.5.2 论文组织结构17-18
  • 第二章 情感分析的研究方法及相关算法18-23
  • 2.1 基于机器学习方法18-20
  • 2.1.1 朴素贝叶斯算法(NB)18-19
  • 2.1.2 最大熵算法(ME)19
  • 2.1.3 支持向量机(SVMs)19-20
  • 2.2 基于词频的方法20-21
  • 2.2.1 语义相关场20
  • 2.2.2 语义相似度20-21
  • 2.3 基于规则的方法21
  • 2.4 性能评估方法21-23
  • 第三章 文本情感分析的流程及应用23-31
  • 3.1 文本预处理23-25
  • 3.1.1 向量空间模型(VSM)23-24
  • 3.1.2 降维操作24-25
  • 3.2 情感信息抽取25-28
  • 3.2.1 特征提取法25-26
  • 3.2.2 情感词典26-28
  • 3.3 选择分类器28
  • 3.4 情感归纳28
  • 3.5 情感分析的应用28-31
  • 3.5.1 机器人的情感计算29
  • 3.5.2 提供决策支持29
  • 3.5.3 网络舆情与风险分析29-30
  • 3.5.4 信息预测30
  • 3.5.5 产品推荐30-31
  • 第四章 基于模糊理论的情感词典建立方法31-43
  • 4.1 模糊理论31-34
  • 4.1.1 模糊理论的概述31-32
  • 4.1.2 模糊理论使用注意事项32-33
  • 4.1.3 模糊理论与文本情感分析的结合33-34
  • 4.2 STEP 算法34-38
  • 4.2.1 STEP 算法的提出35-36
  • 4.2.2 算法的步骤36-37
  • 4.2.3 STEP 算法标注结果及分析37-38
  • 4.3 词语情感程度度量38-42
  • 4.3.1 词语的中心度38-39
  • 4.3.2 度量方法39
  • 4.3.3 实验及结果分析39-41
  • 4.3.4 NOS拓展41-42
  • 4.4 本章小结42-43
  • 第五章 电商网站评论文本的情感计算系统43-67
  • 5.1 系统目标43
  • 5.2 系统架构43-44
  • 5.3 评价语料库准备44-46
  • 5.4 语料预处理46-51
  • 5.4.1 语料分词46-47
  • 5.4.2 词性标注47-50
  • 5.4.3 去除停用词50-51
  • 5.5 领域情感词典与情感信息抽取51-57
  • 5.5.1 领域情感词典51
  • 5.5.2 适用电商领域的情感词典改造51-55
  • 5.5.3 情感信息抽取55-57
  • 5.6 评论文本情感极性分类算法57-60
  • 5.6.1 情感极性加权统计算法57-58
  • 5.6.2 对加权统计算法的改进58-60
  • 5.7 实验及分析60-66
  • 5.7.1 实验环境60-61
  • 5.7.2 数据库设计61-63
  • 5.7.3 实验准备63-64
  • 5.7.4 对比实验结果及分析64-66
  • 5.8 本章小结66-67
  • 第六章 总结和展望67-68
  • 6.1 全文总结67
  • 6.2 展望67-68
  • 致谢68-69
  • 参考文献69-73
  • 在学期间取得的学术成果73

【参考文献】

中国期刊全文数据库 前4条

1 娄德成;姚天f ;;汉语句子语义极性分析和观点抽取方法的研究[J];计算机应用;2006年11期

2 朱嫣岚;闵锦;周雅倩;黄萱菁;吴立德;;基于HowNet的词汇语义倾向计算[J];中文信息学报;2006年01期

3 姚天f ;程希文;徐飞玉;汉思·乌思克尔特;王睿;;文本意见挖掘综述[J];中文信息学报;2008年03期

4 赵妍妍;秦兵;刘挺;;文本情感分析[J];软件学报;2010年08期


  本文关键词:基于电子商务的评论文本情感极性等级分析,由笔耕文化传播整理发布。



本文编号:272566

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/dianzishangwulunwen/272566.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户acdab***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com