基于电子商务的评论文本情感极性等级分析
发布时间:2017-03-28 16:05
本文关键词:基于电子商务的评论文本情感极性等级分析,由笔耕文化传播整理发布。
【摘要】:文本情感分析指研究分析人们对产品、服务、组织机构、事件和话题等进行评价时表达的意见、情感、评价、态度和情绪的特殊自然语言处理研究领域。涉及到多项具有挑战性研究任务,根据研究任务的不同,文本情感分析可以分为情感分类、情感信息抽取、情感信息检索和归纳。研究的过程包括预处理、情感信息抽取、分类器选择、结果归纳展示。 随着web2.0的发展,人们可以通过互联网随时随地发表自己的观点,如博客、论坛、门户网站、电子商务平台等,这些文本能直接或间接反映人的行为和思想,所以研究分析这些文本的情感有许多的用处。关注分析电子商务领域的评论文本情感,无论对消费者还是商家都有重要的意义。目前文本情感分析虽然取得了较大发展,但对情感极性等级分析研究还不足。文本情感存在固有模糊特性,由此可以利用模糊理论的隶属度函数,进行情感极性等级计算。 情感分析主要判断评论文本的情感极性和极性等级,即属于褒义、贬义的强度。根据电子商务领域评论文本的特点,,在已有传统情感分析的基础上,开展对评论句子的情感极性等级分析。首先,通过STEP算法标注WordNet词典中的形容词情感,再用NOS隶属度函数计算词语情感极性等级,构建NOS情感词典。其次,利用整数线性规划(ILP)改造NOS情感词典,得到领域情感词典,使词典最大化适应电子商务领域文本分析。然后,改进传统的加权统计算法,即预先使用投票选举法判断句子极性,再计算情感极性等级,通过与未选举法的极性等级求平均值,作为最终的句子极性值。最后,使用领域情感词典抽取文本中的情感信息,包括情感词典、否定词、程度副词,实现了一个面向电子商务领域的情感分类系统。 实验语料库为12000条评论句子,分别来自家电、酒店、图书类电商网站,通过手工标注语料的褒贬极性作为检验实验结果的金标准。实验结果显示:领域情感词典比NOS词典平均准确率提高了2.7%~6.1%;改进算法比加权统计算法提高了5.7%~9.1%,这说明对情感分析进行的初步尝试有较好效果。
【关键词】:文本情感分析 领域情感词典 模糊理论 整数规划 极性等级计算
【学位授予单位】:重庆交通大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.1
【目录】:
- 摘要4-5
- ABSTRACT5-9
- 第一章 绪论9-18
- 1.1 研究背景9-11
- 1.2 国内外研究现状11-13
- 1.3 研究的目的和意义13-14
- 1.4 研究中的困难与不足14-16
- 1.4.1 研究中的困难14-15
- 1.4.2 发展中的不足15-16
- 1.5 研究内容及组织结构16-18
- 1.5.1 主要研究内容16-17
- 1.5.2 论文组织结构17-18
- 第二章 情感分析的研究方法及相关算法18-23
- 2.1 基于机器学习方法18-20
- 2.1.1 朴素贝叶斯算法(NB)18-19
- 2.1.2 最大熵算法(ME)19
- 2.1.3 支持向量机(SVMs)19-20
- 2.2 基于词频的方法20-21
- 2.2.1 语义相关场20
- 2.2.2 语义相似度20-21
- 2.3 基于规则的方法21
- 2.4 性能评估方法21-23
- 第三章 文本情感分析的流程及应用23-31
- 3.1 文本预处理23-25
- 3.1.1 向量空间模型(VSM)23-24
- 3.1.2 降维操作24-25
- 3.2 情感信息抽取25-28
- 3.2.1 特征提取法25-26
- 3.2.2 情感词典26-28
- 3.3 选择分类器28
- 3.4 情感归纳28
- 3.5 情感分析的应用28-31
- 3.5.1 机器人的情感计算29
- 3.5.2 提供决策支持29
- 3.5.3 网络舆情与风险分析29-30
- 3.5.4 信息预测30
- 3.5.5 产品推荐30-31
- 第四章 基于模糊理论的情感词典建立方法31-43
- 4.1 模糊理论31-34
- 4.1.1 模糊理论的概述31-32
- 4.1.2 模糊理论使用注意事项32-33
- 4.1.3 模糊理论与文本情感分析的结合33-34
- 4.2 STEP 算法34-38
- 4.2.1 STEP 算法的提出35-36
- 4.2.2 算法的步骤36-37
- 4.2.3 STEP 算法标注结果及分析37-38
- 4.3 词语情感程度度量38-42
- 4.3.1 词语的中心度38-39
- 4.3.2 度量方法39
- 4.3.3 实验及结果分析39-41
- 4.3.4 NOS拓展41-42
- 4.4 本章小结42-43
- 第五章 电商网站评论文本的情感计算系统43-67
- 5.1 系统目标43
- 5.2 系统架构43-44
- 5.3 评价语料库准备44-46
- 5.4 语料预处理46-51
- 5.4.1 语料分词46-47
- 5.4.2 词性标注47-50
- 5.4.3 去除停用词50-51
- 5.5 领域情感词典与情感信息抽取51-57
- 5.5.1 领域情感词典51
- 5.5.2 适用电商领域的情感词典改造51-55
- 5.5.3 情感信息抽取55-57
- 5.6 评论文本情感极性分类算法57-60
- 5.6.1 情感极性加权统计算法57-58
- 5.6.2 对加权统计算法的改进58-60
- 5.7 实验及分析60-66
- 5.7.1 实验环境60-61
- 5.7.2 数据库设计61-63
- 5.7.3 实验准备63-64
- 5.7.4 对比实验结果及分析64-66
- 5.8 本章小结66-67
- 第六章 总结和展望67-68
- 6.1 全文总结67
- 6.2 展望67-68
- 致谢68-69
- 参考文献69-73
- 在学期间取得的学术成果73
【参考文献】
中国期刊全文数据库 前4条
1 娄德成;姚天f ;;汉语句子语义极性分析和观点抽取方法的研究[J];计算机应用;2006年11期
2 朱嫣岚;闵锦;周雅倩;黄萱菁;吴立德;;基于HowNet的词汇语义倾向计算[J];中文信息学报;2006年01期
3 姚天f ;程希文;徐飞玉;汉思·乌思克尔特;王睿;;文本意见挖掘综述[J];中文信息学报;2008年03期
4 赵妍妍;秦兵;刘挺;;文本情感分析[J];软件学报;2010年08期
本文关键词:基于电子商务的评论文本情感极性等级分析,由笔耕文化传播整理发布。
本文编号:272566
本文链接:https://www.wllwen.com/jingjilunwen/dianzishangwulunwen/272566.html