基于网络评论的情感分类模型研究

发布时间:2021-05-07 08:10
  网络高度发达的今天,越来越多的社交网络和电商平台渗透到了生活的方方面面。人们不仅仅是网络信息的接受者,也是信息的生产者,众多用户发表的网络评论蕴藏着巨大价值。对网络评论进行情感分析,政府部门可以及时获悉群众对某个重大事件的舆论趋势,用户可以了解某产品的特性,商家也可以获知用户的需求,了解产品的不足,及时调整营销策略。现有情感分类方法主要有情感词典方法和机器学习方法。情感词典方法过于依赖词典中的情感词,情感词典越完备,网络评论情感倾向越显著,分类效果越好,而对情感倾向不易区分的评论分类效果欠佳。机器学习方法是一种有监督的方法,其分类效果依赖于大量事先标注过的语料,目前语料标注是通过人工完成,工作量极大。针对上述问题,综合情感词典和机器学习两种方法的特点构建了一个网络评论情感分类模型,利用相关领域网络评论对情感词典进行扩充,基于情感词典方法的分类结果,通过自监督学习训练一个分类器,进而提高情感倾向模糊文本的分类正确率。主要研究内容如下:(1)基于情感词典方法研究。在已有情感词典的基础上扩充情感词典,依靠词典和规则计算情感值,根据情感值进行分类。实验发现,词典越完备,情感值绝对值越高,正确率... 

【文章来源】:河南财经政法大学河南省

【文章页数】:67 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
1 绪论
    1.1 课题研究背景与意义
    1.2 国内外研究现状
        1.2.1 情感词典分类方法研究现状
        1.2.2 机器学习分类方法研究现状
    1.3 主要研究内容
    1.4 论文组织结构
    1.5 论文的创新点
2 文本预处理和相关理论介绍
    2.1 网络评论获取及预处理
        2.1.1 网络评论获取
        2.1.2 网络评论预处理
    2.2 情感分类方法
        2.2.1 基于情感词典的分类方法
        2.2.2 基于机器学习的分类方法
    2.3 点互信息算法介绍
    2.4 WORD2VEC模型介绍
    2.5 特征提取
    2.6 分类算法
        2.6.1 逻辑回归算法
        2.6.2 支持向量机算法
        2.6.3 随机森林算法
3 情感词典和机器学习两种传统方法问题分析
    3.1 基于情感词典的分类方法
        3.1.1 情感词典
        3.1.2 基于情感词典的情感分类流程
        3.1.3 SO-PMI算法扩充情感词典
    3.2 基于机器学习的分类方法
        3.2.1 基于机器学习的情感分类流程
        3.2.2 词向量与特征提取
    3.3 情感词典方法和机器学习方法的问题分析
        3.3.1 情感词典方法的问题分析
        3.3.2 机器学习方法的问题分析
4 融合情感词典和机器学习的分类模型
    4.1 融合情感词典和机器学习的分类模型
    4.2 扩充情感词典
    4.3 情感值的计算
    4.4 确定集和不确定集的筛选
    4.5 修正不确定集的分类结果
5 实验结果与分析
    5.1 数据集
    5.2 情感分类模型评价指标
    5.3 结果与分析
        5.3.1 word2vec与 SO-PMI结合扩充词典的分类效果
        5.3.2 不同机器学习分类算法的分类效果
        5.3.3 融合情感词典和机器学习的分类模型效果
6 总结与展望
    6.1 论文总结
    6.2 进一步的工作
参考文献
攻读学位期间科研成果
致谢


【参考文献】:
期刊论文
[1]文本情感分析方法研究综述[J]. 洪巍,李敏.  计算机工程与科学. 2019(04)
[2]结合word2vec与扩充情感词典的微博多元情感分类研究[J]. 王名扬,吴欢,贾晓婷.  东北师大学报(自然科学版). 2019(01)
[3]基于领域词典的网络商品评论情感分析[J]. 孔伟俊,胡广朋.  计算机与数字工程. 2018(01)
[4]基于词向量的电影评论情感分析方法[J]. 殷复莲,潘幸艺,柴剑平.  现代电影技术. 2017(08)
[5]基于词向量模型的情感分析[J]. 魏广顺,吴开超.  计算机系统应用. 2017(03)
[6]领域知识学习中的马尔可夫逻辑网应用研究[J]. 于凤,郑德权,刘祥.  计算机工程与应用. 2016(22)
[7]基于情感分析的新浪微博争议度分析[J]. 刘莉平,刘梦,李绍鹏.  计算机工程与科学. 2016(10)
[8]一种多义词词向量计算方法[J]. 曾琦,周刚,兰明敬,王濛.  小型微型计算机系统. 2016(07)
[9]基于词典与机器学习的中文微博情感分析研究[J]. 孙建旺,吕学强,张雷瀚.  计算机应用与软件. 2014(07)
[10]基于双语信息和标签传播算法的中文情感词典构建方法[J]. 李寿山,李逸薇,黄居仁,苏艳.  中文信息学报. 2013(06)

硕士论文
[1]基于领域词典与机器学习的中文评论情感分析[D]. 杨鹏.南京邮电大学 2018
[2]电商评论情感分析关键技术研究[D]. 熊乐.南昌大学 2018
[3]基于卷积神经网络的文本分类器的设计与实现[D]. 白璐.北京交通大学 2018
[4]基于网络评论的情感分类技术的研究及应用[D]. 郭捷.电子科技大学 2018
[5]基于图像特征分布的高光谱波段选择研究[D]. 李星华.西安电子科技大学 2017
[6]基于改进RFM模型的网络消费者价值识别研究[D]. 张继艳.南华大学 2015
[7]质量安全网络信息分类系统的设计与实现[D]. 丁勇.华中科技大学 2014
[8]领域知识指导的半监督学习和主动学习倾向性分类研究[D]. 麦永康.华南理工大学 2011



本文编号:3173056

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3173056.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2b7e5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com