当前位置:主页 > 科技论文 > 自动化论文 >

情感文本的识别与分类算法的研究与实现

发布时间:2023-03-26 19:00
  近年来,互联网中的社交媒体信息迅速增长,利用好这些网络文本数据,并挖掘和分析其中有价值的情感信息,是非常有意义的。所以情感倾向性分析任务已经成为了自然语言处理领域的研究热点。海量的网络文本中,包含观点句和非观点句,其中的观点句也就是主观性文本才是情感分析研究的对象。因此本文首先实现了对主观性文本的分析和提取,再对主观文本进行了进一步的情感分析,研究其是否能够辅助情感倾向性的计算。论文的主要工作包括:(1)在进行情感文本的识别过程中,本文将词语的词性特征作为主客观分类的重要线索。根据词性标注的结果总结了九类主观特征的词性种类。将词性特征与词向量拼接,结合卷积神经网络,并通过实验确定了词性向量的合理维度和卷积核的大小,设计了基于词性特征和卷积神经网络的主客观分类模型。根据实验结果统计加入词性特征使得模型准确率提高了 2%,并比传统的基于N-POS和支持向量机的主客观分类模型准确率提高了将近4%。(2)在进行主观文本的情感倾向性计算时,文本中的转折句和总结句影响着整个句子的整体倾向性。因此本文提出了基于主干分析的情感分析计算方法。本文总结了包含23个转折性连词和总结性连词的连词词典,通过与连...

【文章页数】:69 页

【学位级别】:硕士

【文章目录】:
致谢
摘要
ABSTRACT
1 引言
    1.1 背景及意义
    1.2 主客观分类问题研究现状
    1.3 情感分析问题研究现状
    1.4 论文的主要内容及结构
        1.4.1 主要研究内容
        1.4.2 论文结构
2 基础理论与技术
    2.1 文本预处理和词向量表示
        2.1.1 分词
        2.1.2 词性标注
        2.1.3 词向量相关理论
    2.2 传统机器学习文本分类算法
        2.2.1 文本特征提取方法
        2.2.2 朴素贝叶斯模型
        2.2.3 支持向量机模型
    2.3 基于深度学习的文本分类算法
        2.3.1 人工神经网络
        2.3.2 卷积神经网络
        2.3.3 循环神经网络
        2.3.4 长短期记忆网络
    2.4 分类结果评估
    2.5 本章小结
3 基于词性特征和卷积神经网络的主客观识别模型
    3.1 引言
    3.2 词语的词性特征和向量表示
    3.3 基于词性特征的卷积神经网络模型
        3.3.1 模型的结构
        3.3.2 模型的原理
    3.4 模型评估
        3.4.1 数据集
        3.4.2 数据预处理和训练词向量
        3.4.3 模型参数设置
        3.4.4 模型对比实验
        3.4.5 实验结果分析
    3.5 本章小结
4 基于主干分析和权重词向量的情感分类模型
    4.1 句子主干分析
    4.2 词向量的情感权重计算
    4.3 情感分类模型
    4.4 实验评估
        4.4.1 实验数据集
        4.4.2 对比实验分析
        4.4.3 实验结果分析
    4.5 本章小结
5 总结和展望
参考文献
作者简历及攻读硕士学位期间取得的研究成果
学位论文数据集



本文编号:3771525

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3771525.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c0525***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com