当前位置:主页 > 科技论文 > 自动化论文 >

基于词向量扩充技术的文本情感分析研究

发布时间:2021-05-12 02:27
  自然语言处理是计算机科学与语言学的交叉学科,主要研究的是计算机怎么处理和分析自然语言。情感分析(Sentiment Analysis,SA)是一个知识领域,它涉及人们对特定实体的意见、情绪、评估和态度。情感值的表示可以是离散的类别,如正面、负面、中性,也可以是连续的情感强度。情感分析主要是从数据集(推特、微博、贴吧论坛、电商网站的评论等)中提取评论者的主观情感信息,这对分析社交媒体和预测网络平台上的公众观点有很重要的意义,同时有利于商家或者媒体把握用户的喜好。随着深度学习研究的深入,在自然语言处理领域,尤其是情感分析这个研究方向出现了很多新的成果。本文对现有的情感分析技术和模型进行分析和研究,把单词的词典表征和向量表征相结合同时借助深度学习模型对所提出的技术进行实验论证。本文主要有三个方面的工作:1.首先对文本进行预处理,考虑到推特的社交性,需要处理表情符号、哈希标签、单词缩写、网址和标点符号等。同时还对停用词进行处理,并将所有单词转化为小写。2.然后用词嵌入将输入转化成深度学习模型能处理的二维矩阵,每条推特数据都是由相应的字向量在数据中叠加的二维数组。在拥有注释词典的基础上,对单词的... 

【文章来源】:云南大学云南省 211工程院校

【文章页数】:58 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第一章 绪论
    1.1 研究背景
    1.2 研究现状
    1.3 研究内容
    1.4 组织结构
第二章 文本情感分析
    2.1 文本预处理的过程
    2.2 基于规则的情感分析
    2.3 基于机器学习的情感分析
    2.4 基于深度学习的情感分析
    2.5 本章小结
第三章 词向量扩充技术
    3.1 词向量
    3.2 情感词典
    3.3 词向量扩充
    3.4 本章小结
第四章 基于词向量扩充技术的文本情感分析
    4.1 研究动机
    4.2 基于BiLSTM的两层模型
        4.2.1 Embedding层
        4.2.2 BiLSTM层
        4.2.3 线性解码器
    4.3 多方面情感强度回归任务
        4.3.1 实验数据
        4.3.2 数据预处理
        4.3.3 调参和模型融合
        4.3.4 实验评估指标
        4.3.5 实验结果分析
    4.4 多方面情感强度分类任务
        4.4.1 实验数据
        4.4.2 数据预处理
        4.4.3 调参和模型融合
        4.4.4 实验评估指标
        4.4.5 实验结果分析
    4.5 Valence情绪下情感强度回归任务
        4.5.1 实验数据
        4.5.2 数据预处理
        4.5.3 调参和模型融合
        4.5.4 实验评估指标
        4.5.5 实验结果分析
    4.6 本章小结
第五章 总结
    5.1 论文的主要贡献和工作
    5.2 今后研究工作
参考文献
硕士期间完成的科研成果
致谢



本文编号:3182557

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3182557.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b8fcb***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com