当前位置:主页 > 科技论文 > 自动化论文 >

基于机器学习的中文豆瓣影评情感强度分析

发布时间:2023-11-12 16:14
  文本情感倾向和情感强度分类一直是自然语言处理领域中的研究热点。文本情感分类是一门综合语言学、生理学、计算机学、自然语言处理的交叉性研究课题。本文基于中文豆瓣短影评的语料,从传统机器学习和深度学习两个重要的文本挖掘方法出发,研究中文豆瓣影评的情感极性和情感强度分类,提出结合深度神经网络CNN-CRFs的机器学习模型结构,情感分类效果得到显著提升。主要研究内容和创新点介绍如下:1、阐述了自然语言处理领域文本挖掘的研究背景与意义。基于中文影评情感分类,研究了时下热门的技术与理论知识。结合深度学习方法的研究现状以及意义,分析了深度神经网络的结构特点以及在处理文本挖掘方面的常用方法。2、基于本文提取的观点句,比较传统机器学习模型和深度神经网络机器学习模型的情感强度分类效果,提出两种方法相融合的分类模型。3、构建三分类的情感知识库,将领域无关情感词、领域有关情感词和网络用语收入其中并扩充词量。比较文本特征与情感特征、基于规则的与基于机器学习的方法以及算法模型之间在辨别观点句时的分类效果。4、提出基于层级的传统机器学习分类方法,将情感倾向性分类和情感强度分类单独处理。先将SVM模型用于情感倾向性三分...

【文章页数】:80 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第一章 绪论
    1.1 研究的背景及意义
    1.2 国内外研究现状
        1.2.1 对文本情感分析的研究
        1.2.2 基于电影评论的情感分析的研究
        1.2.3 基于深度学习文本挖掘的研究
    1.3 本文的贡献
    1.4 论文结构
第二章 相关理论和工具
    2.1 文本特征提取方法
    2.2 分类算法分析
    2.3 常用工具介绍
    2.4 本章小结
第三章 基于观点句提取的特征比较方法
    3.1 预处理
        3.1.1 分词与标注
        3.1.2 三分类情感词典构建
    3.2 基于规则的观点句提取方法
        3.2.1 观点句提取基本步骤
        3.2.2 消除无指代的规则处理方法
    3.3 基于机器学习的观点句提取算法
        3.3.1 三种方法的实现
        3.3.2 文本特征
        3.3.3 情感特征
    3.4 基于规则和机器学习的观点句提取方法
    3.5 实验结果和讨论
        3.5.1 实验数据
        3.5.2 实验标准
        3.5.3 实验结果与讨论
    3.6 本章小结
第四章 基于层级统计分类方法的情感倾向性和情感强度分析
    4.1 情感极性相关研究
    4.2 情感倾向性分析
        4.2.1 特征选取
        4.2.2 分类器选取
    4.3 情感强度分析
    4.4 实验结果和讨论
    4.5 本章小结
第五章 基于CNN-CRFs的文本情感强度分析
    5.1 深度学习的实现
        5.1.1 深度神经网络
        5.1.2 深度学习理论
        5.1.3 深度学习常用实现方法
    5.2 卷积神经网络
        5.2.1 卷积神经网络结构
    5.3 基于CNN-CRFs的文本情感强度分析
    5.4 实验结果和讨论
    5.5 本章小结
第六章 总结与展望
    6.1 总结
    6.2 展望
参考文献
致谢
攻读学位期间发表的学术论文



本文编号:3863498

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3863498.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3b42f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com