当前位置:主页 > 经济论文 > 服务经济论文 >

酒店在线评论的情感倾向挖掘方法应用研究

发布时间:2017-10-28 03:26

  本文关键词:酒店在线评论的情感倾向挖掘方法应用研究


  更多相关文章: 在线评论 情感倾向分析 机器学习 随机森林 SVM


【摘要】:愈来愈多的在线消费用户开始浏览大量的网络评论来了解产品和服务的口碑,帮助自己做出可靠的决策。同时网络客户评论作为反馈机制也帮助了服务提供商改进其服务从而获得竞争力。但是,网络评论数量的飞速增长,使得信息内容越来越庞杂,造成客户评论中有用信息难以获取的后果,尤其使得客户难以在短时间内获得对于人物、事件、产品的观点和态度。因此,迫切需要一定的技术手段来使这一过程变得更为准确而便捷,此时“评论挖掘”应运而生并吸引了众多研究者进行学习和研究。评论挖掘主要涉及情感倾向分析、特征挖掘、主观内容识别等;其中情感倾向性分析目的是通过挖掘和分析文本中的立场、观点、情绪、好恶等主观信息,对文本中的主观态度进行判断,涉及人工智能、机器学习、数据挖掘、自然语言处理等多个领域。在英文评论研究领域,研究者已初步取得一些成果,而针对中文网络用户评论的研究却仍处于起步阶段。随着中国电子商务在世界领域内的崛起,亟需关于中文评论中有用信息的自动提取的先进技术。本文以中文网络中对形成旅游预订决策非常重要的酒店评论为研究对象展开探讨。酒店在线评论是非常具有代表性的,与其它在线评论不同的是其更受客户的依赖,对客户是否进行产品预订或购买起到决定性作用;它是顾客对酒店服务质量的真实感知,学术界已有利用其进行酒店服务质量研究的相关成果,但多采用内容分析法,不能对评论进行批量处理,成果应用大受限制。 基于以上问题,本文采用机器学习的方法针对网络评论文本进行情感倾向性分析研究,旨在为中文领域内的客户和企业提供更为方便和科学的评论挖掘工具。本文采用开源爬虫框架从携程网客户评论获取语料并按六种不同的评价对象类别进行分类;重点详细介绍了语料库的预处理,包括中文分词和去无用词;然后选用随机森林降序排列特征提取方法和SVM标准分类器,结合本文提出的客户评论情感模型在R语言环境中实现了多种算法分类结果的进一步改善;实验结果表明该计算路径下得到的分类效果更好、准确率更高,不仅克服了文本分析中高维稀疏的数据问题及训练集中的噪声问题,并具有稳定的面向海量web文本切分的实用性能,实验结果还表明这种分类后的倾向性分析更能准确和细致地反映客户的立场和观点,帮助管理者快速地掌握客户对于酒店各个方面的喜爱或者厌恶程度,具有实际的意义。
【关键词】:在线评论 情感倾向分析 机器学习 随机森林 SVM
【学位授予单位】:广东工业大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.1;F713.36;F719
【目录】:
  • 摘要4-5
  • Abstract5-6
  • 目录6-9
  • Content9-11
  • 第一章 绪论11-19
  • 1.1 研究背景及意义11-14
  • 1.1.1 研究背景11-13
  • 1.1.2 研究意义13-14
  • 1.2 研究内容及组织结构14-16
  • 1.2.1 研究对象及主要内容14-16
  • 1.2.2 论文具体章节结构16
  • 1.3 技术路线与创新点16-18
  • 1.3.1 技术路线16-17
  • 1.3.2 创新点17-18
  • 1.4 课题来源18-19
  • 第二章 随机森林和支持向量机理论综述19-32
  • 2.1 情感分析技术研究现状19-23
  • 2.1.1 情感分析国内外研究现状19-21
  • 2.1.2 机器学习方法21-23
  • 2.2 随机森林特征提取23-28
  • 2.2.1 RF的概念、特点及生成过程23-25
  • 2.2.2 特征提取的研究现状25-26
  • 2.2.3 随机森林用于提取特征26-28
  • 2.3 支持向量机28-31
  • 2.3.1 SVM的概念和特点28-29
  • 2.3.2 SVM的目标和优势29-30
  • 2.3.3 R中的SVM标准分类30-31
  • 2.4 本章小结31-32
  • 第三章 情感心理模型与评论文本初步挖掘32-46
  • 3.1 中文文本情感模型32-36
  • 3.1.1 情感心理模型研究现状32-34
  • 3.1.2 中文在线评论的情感心理模型的构建34
  • 3.1.3 中文在线评论的情感心理模型的确立34-36
  • 3.2 评论文本初步挖掘36-45
  • 3.2.1 网络爬虫36-40
  • 3.2.2 网页信息提取40-42
  • 3.2.3 中文分词42-44
  • 3.2.4 停止词表44-45
  • 3.3 本章小结45-46
  • 第四章 R语言环境下的情感倾向分析46-65
  • 4.1 R概述46-48
  • 4.1.1 R语言及其特点介绍46-47
  • 4.1.2 R环境下的实验目标47-48
  • 4.1.3 R环境下的计算路径48
  • 4.2 实验部分48-64
  • 4.2.1 实验流程及步骤49-50
  • 4.2.2 R运行环境及安装配置50-57
  • 4.2.3 参数设置及实现代码57-61
  • 4.2.4 实验结果及分析61-64
  • 4.3 本章小结64-65
  • 结论65-66
  • 参考文献66-71
  • 攻读学位期间发表的论文71-73
  • 致谢73

【引证文献】

中国博士学位论文全文数据库 前1条

1 童碧莎;我国旅游市场秩序的演变、评价及对策研究[D];北京交通大学;2016年



本文编号:1106476

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/fwjj/1106476.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d341b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com