基于长短时记忆网络的网络评论文本情感分类研究

发布时间:2021-07-20 01:36
  随着互联网技术的不断发展,各类信息不断朝着多元化与海量化的方向发展。对各类信息进行整理分析的需求呈现爆炸式增长。作为数据挖掘中的一项重要任务,文本情感分类逐渐成为相关领域的研究热点。传统的文本情感分类方法大都基于人工设计特征并进行提取的方法,但由于语义信息的抽象性,仅仅通过统计信息无法准确捕捉深层的语义信息。为解决这一问题,本课题基于长短时记忆网络(LSTM),设计了自动提取文本特征的文本情感分类模型,并开展实验研究。针对文本中语句较长,单词量较大,不利于语义信息提取的问题,本文采用分级网络结构思想,结合长短时记忆网络进行特征提取。利用文本“词-句-篇”的结构特点,对文本结构拆分,进行二次特征提取过程,首先以词为基本单位进行单词级的特征提取得到句子的特征向量,再以句子为基本单位进行句子级的特征提取得到篇章级的特征表示,从而实现文本的特征提取完成分类任务。针对长短时记忆网络在不同时刻所提取到的特征进行选择的问题,在网络编码阶段引入注意力机制,并结合分级网络结构思想,构建H-LSTM-AM模型;基于卷积神经网络对局部信息敏感的特点,将卷积神经网络(CNN)引入到句子级的编码中,构建LSTM... 

【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校

【文章页数】:59 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第1章 绪论
    1.1 课题背景及研究的目的和意义
    1.2 国内外研究现状
        1.2.1 文本表示研究现状
        1.2.2 机器学习在文本情感分类上的应用
        1.2.3 深度学习在文本情感分类上的应用
    1.3 本文的主要研究内容
第2章 深度学习相关研究
    2.1 词向量
    2.2 循环神经网络及变种
        2.2.1 循环神经网络
        2.2.2 长短时记忆网络
    2.3 卷积神经网络
    2.4 注意力机制
    2.5 本章小结
第3章 基于LSTM的文本情感分类模型设计
    3.1 文本数据预处理
    3.2 分级注意力模型结构(H-LSTM-AM)
        3.2.1 分级网络结构
        3.2.2 H-LSTM-AM模型
        3.2.3 H-LSTM-AM模型训练
    3.3 LSTM-CNN模型
        3.3.1 TextCNN模型
        3.3.2 LSTM-CNN模型
    3.4 权重损失函数
        3.4.1 样本不均衡问题
        3.4.2 权重损失函数
    3.5 集成学习Bagging机制
    3.6 本章小结
第4章 实验验证与分析
    4.1 实验准备与说明
        4.1.1 实验数据集
        4.1.2 评价指标
        4.1.3 实验环境
    4.2 模型对比实验与分析
    4.3 模型超参数调整
        4.3.1 词向量
        4.3.2 隐藏层单元数
        4.3.3 激活函数
    4.4 权重损失函数有效性验证
    4.5 集成学习有效性验证
    4.6 模型可视化
    4.7 本章小结
结论
参考文献
攻读硕士学位期间发表的论文及其它成果
致谢



本文编号:3291851

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3291851.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户dee22***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com