基于词典和机器学习的酒店评论情感分析

发布时间:2021-12-24 13:47
  随着电子商务与社交网络的快速发展,互联网平台中每日产生海量的个人言论和商品服务的评论。这些评论包含人们的各种情感并且蕴含巨大的商业价值。由于数据来源广泛,数量巨大,每时每刻都在增长变化,若通过人工方式来挖掘这些庞大的信息,不仅耗时耗力而且成效甚微,所以需要通过情感分析技术对海量的文本数据进行处理与分析。情感分析是自然语言处理领域的一个重要研究方向,具有重要的研究价值和实际的应用价值。本文主要对酒店领域的用户评论进行情感分析,从中挖掘用户对酒店服务等方面的态度,为酒店提高服务质量提供一定的帮助。本文主要工作如下:(1)以通用的中文情感词典为基础并将酒店评论数据作为扩充词典的语料,构造适用于酒店评论的情感词典。使用通用的词典与本文构造的情感词典对同一语料进行情感分类,并比较分类结果。实验结果表明:在正向与负向分类中,本文构造的词典在准确率上分别是76.5%及80.4%,优于通用词典的分类效果。(2)由于词向量表示方法未能考虑文本中词语的重要程度,因此本文将特征权值与词向量相结合,提出加权词向量,将普通词向量与加权词向量分别作为文本表示的方法,并利用支持向量机进行分类实验。实验结果表明:使用... 

【文章来源】:江苏科技大学江苏省

【文章页数】:72 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状和发展趋势
        1.2.1 基于情感词典的情感分析
        1.2.2 基于机器学习的情感分析
    1.3 本文主要研究内容
    1.4 本文章节结构
    1.5 本章小结
第2章 情感分析相关理论
    2.1 情感分析基本含义
    2.2 情感分析的分类及流程
        2.2.1 情感分析的分类
        2.2.2 情感分析的流程
    2.3 文本预处理
        2.3.1 中文分词
        2.3.2 停用词
        2.3.3 词性标注
    2.4 文本特征选择
        2.4.1 信息增益
        2.4.2 互信息
        2.4.3 文档频率
        2.4.4 期望交叉熵
        2.4.5 卡方统计
    2.5 文本表示
        2.5.1 布尔模型
        2.5.2 概率模型
        2.5.3 向量空间模型
    2.6 分类评测标准
        2.6.1 评测指标
        2.6.2 评测平台
    2.7 本章小结
第3章 情感词典的构造及情感值计算
    3.1 基础情感词典
    3.2 修饰词词典
        3.2.1 程度副词词典
        3.2.2 否定词词典
    3.3 基于SO-PMI算法的情感词典扩充
    3.4 基于酒店评论的情感词典构建
    3.5 基于情感词典计算情感值
    3.6 实验及结果分析
    3.7 本章小结
第4章 基于TFIDF情感权值的词向量表示
    4.1 常见特征权值计算方法
        4.1.1 布尔权值
        4.1.2 熵权值
        4.1.3 TFIDF权值
    4.2 词向量表示
    4.3 改进TFIDF算法
    4.4 基于改进TFIDF的词向量表示
    4.5 本章小结
第5章 基于酒店评论数据的情感分析
    5.1 分类算法介绍
        5.1.1 朴素贝叶斯
        5.1.2 支持向量机
    5.2 实验设置及结果分析
        5.2.1 实验数据集
        5.2.2 实验环境
        5.2.3 实验流程
        5.2.4 数据预处理
        5.2.5 基于情感词典构建训练集
        5.2.6 词向量训练和表示
        5.2.7 实验及结果分析
    5.3 本章小结
总结与展望
参考文献
攻读学位期间发表的学术论文
致谢
大摘要


【参考文献】:
期刊论文
[1]基于卷积神经网络参数优化的中文情感分析[J]. 王盛玉,曾碧卿,胡翩翩.  计算机工程. 2017(08)
[2]基于卷积神经网络和注意力模型的文本情感分析[J]. 冯兴杰,张志伟,史金钏.  计算机应用研究. 2018(05)
[3]文本情感分析综述[J]. 杨立公,朱俭,汤世平.  计算机应用. 2013(06)
[4]一种基于朴素贝叶斯的微博情感分类[J]. 林江豪,阳爱民,周咏梅,陈锦,蔡泽键.  计算机工程与科学. 2012(09)
[5]基于单层标注级联模型的篇章情感倾向分析[J]. 李本阳,关毅,董喜双,李生.  中文信息学报. 2012(04)
[6]基于机器学习的中文微博情感分类实证研究[J]. 刘志明,刘鲁.  计算机工程与应用. 2012(01)
[7]文本情感分析[J]. 赵妍妍,秦兵,刘挺.  软件学报. 2010(08)
[8]互联网商品评论情感分析研究综述[J]. 张紫琼,叶强,李一军.  管理科学学报. 2010(06)
[9]中文基础情感词词典构建方法研究[J]. 柳位平,朱艳辉,栗春亮,向华政,文志强.  计算机应用. 2009(10)
[10]中文分词算法研究综述[J]. 张启宇,朱玲,张雅萍.  情报探索. 2008(11)

博士论文
[1]基于机器学习的文本情感分类研究[D]. 张庆庆.西北工业大学 2016
[2]中文词法句法语义联合分析模型研究[D]. 张梅山.哈尔滨工业大学 2014
[3]文本分类中文本表示模型和特征选择算法研究[D]. 杨杰明.吉林大学 2013

硕士论文
[1]基于词典和机器学习组合的情感分析[D]. 丁蔚.西安邮电大学 2017
[2]基于文本挖掘的电商用户评论分析与系统实现[D]. 易剑波.东南大学 2017
[3]社交媒体文本情感分析[D]. 姜杰.南京理工大学 2017
[4]基于酒店中文评论情感倾向分析[D]. 李长江.华南理工大学 2016
[5]基于电商网站商品评论数据的用户情感分析[D]. 崔志刚.北京交通大学 2014
[6]基于情感词典的中文微博情感倾向分析研究[D]. 陈晓东.华中科技大学 2012



本文编号:3550594

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3550594.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户cf20e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com