基于显性语义方法的网络新词识别及其情感极性分析

发布时间:2023-05-12 21:15
  随着网络信息通信的迅速发展,微博、微信等社交网络上短文本形式的使用量激增。特别是在数据爆炸的时代背景下,社交网络已然是网络短文本形成和流传的最大聚集地。在自然语言处理研究领域中,由于不能准确识别这些互联网新词导致对于这类文本的分析理解困难,尤其是文本中的网络新词识别及其语义情感理解方面。缺乏新词的解读能力意味着无法理解用户表达内容,也无法进行正确的舆论引导,因此对于网络新词的识别、语义理解和情感分析研究意义重大。本文主要研究内容是社交网络中的产生的新新词汇识别及其情感极性分析。在短文本的情感识别研究中,词语的情感倾向分析是判别短文本整体情感的关键。新词以其通俗精简又有趣的表达能力而被互联网用户广泛使用,然而在传统的语料库中没有这些网络新词,因此传统的情感分析方法对这类文本处理困难。处理情感分析的基础是文本分词准确且单词情感倾向识别无误,微博这类社交网络短文本中的网络新词又是影响分词准确度和理解准确度的主要原因。为了克服传统方法无法识别网络新词的缺点,提出了一种融合网络实体链接和显性语义分析方法的网络新词识别方法。该方法以短语的粗粒度对原文进行分词,目的是尽可能保留原文的逻辑防止误读,分...

【文章页数】:63 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第一章 绪论
    1.1 课题来源
    1.2 课题研究的目的和意义
    1.3 国内外研究概况
    1.4 论文的主要研究内容
    1.5 论文结构
第二章 相关概念与技术
    2.1 网络新词概述
        2.1.1 网络新词定义
        2.1.2 网络新词识别难点
    2.2 传统词语识别方法
        2.2.1 基于字符串的词语识别
        2.2.2 基于语料库的词语识别
        2.2.3 基于本体的词语识别
    2.3 情感分析相关理论
        2.3.1 情感分析概述
        2.3.2 情感极性识别方法概述
        2.3.3 点互信息算法概述
第三章 基于显性语义分析的网络新词识别方法
    3.1 语料库选择
    3.2 文本分词
    3.3 网络知识图谱识别语义
        3.3.1 知识图谱概述
        3.3.2 分析知识图谱提供的信息
    3.4 显性语义分析方法
        3.4.1 改进显性语义分析算法
        3.4.2 新词识别系统流程
    3.5 实验结果与分析
        3.5.1 实验数据
        3.5.2 实验结果评价方法
        3.5.3 微博分词实验
        3.5.4 新词识别准确度实验
        3.5.5 网络新词理解实验
    3.6 本章小结
第四章 基于Word2Vec与 SO-PMI的情感极性分析
    4.1 词向量相关概念与理论
        4.1.1 词向量概念
        4.1.2 神经网络语言模型
        4.1.3 Word2Vec基本原理
    4.2 融合w2v和 SO-PMI的情感识别方法
        4.2.1 微博文本转换词向量
        4.2.2 SO-PMI情感倾向点互信息
        4.2.3 改进的词语情感极性分析
    4.3 网络新词的情感极性分析系统
        4.3.1 微博表情情感识别方法
        4.3.2 新词情感极性分析流程
    4.4 实验结果与分析
        4.4.1 实验结果评价方法
        4.4.2 新词情感识别实验
        4.4.3 微博表情情感实验
    4.5 本章小结
第五章 总结与展望
    5.1 论文总结
    5.2 展望
参考文献
作者在攻读硕士学位期间公开发表的论文
作者在攻读硕士学位期间所作的项目
致谢



本文编号:3814648

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3814648.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ff972***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com