基于标签传播的网络评论情感分析

发布时间:2021-04-03 01:51
  随着“web3.0”时代以及新媒体时代的到来,以社交平台为载体获取最新资讯、传递个人观点、表达群体诉求成为社会发展的重要趋势。而情感分析的目的是为了找出表达群体在某些话题上或者针对一个文本观点的态度以挖掘出有价值的信息,这些有价值的信息可以服务方方面面。因此,情感分析起着举足轻重的作用。然而数据量的暴增,导致了情感分析过程中人力物力的大量损耗。在此基础上,计算机自动完成情感分析的技术应运而生。情感词典作为情感分析任务中极为重要的工具,其构建问题也逐步成为自然语言处理领域的热门研究方向。但现有的情感词典存在覆盖率有限、领域适应能力较差等问题。因此,构建覆盖率较广,领域适应能力较强的情感词典成为了此领域的核心挑战。本文将半监督学习方法-标签传播运用到情感词典的构建中,通过构建覆盖率广,领域适应能力较强的情感词典来提升对网络评论进行情感分析的准确率。基于上述的研究背景,本文针对网络评论情感分析所做的工作如下:1.为了处理情感词典覆盖率有限、领域适应能力较差等问题,本文提出了一种新的种子词选取方法。先基于通用词典人工选取种子词,再利用人工选取的种子词在语料上进行词向量训练,进一步选择从而得到扩... 

【文章来源】:重庆邮电大学重庆市

【文章页数】:65 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第1章 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
        1.2.1 情感词典的适应领域
        1.2.2 情感词典的构建方式
    1.3 论文主要工作
    1.4 论文组织结构
第2章 理论基础及相关工作
    2.1 半监督学习
        2.1.1 标签传播算法
    2.2 词向量介绍
        2.2.1 CBOW模型
        2.2.2 Skip-Gram模型
    2.3 相似度度量
        2.3.1 基于距离的相似性度量
        2.3.2 基于相似性系数的度量
        2.3.3 相关性度量-互信息
    2.4 情感词典
        2.4.1 常见情感词典资源
        2.4.2 情感词典的扩充
    2.5 中文分词技术
        2.5.1 基于字符串匹配的分词方法
        2.5.2 基于理解的分词方法
        2.5.3 基于统计以及机器学习的分词方法
    2.6 本章小结
第3章 基于标签传播的情感词典构建
    3.1 引言
    3.2 算法描述
        3.2.1 种子词的选择
        3.2.2 通过Word2Vec工具提取候选情感词
        3.2.3 通过标签传播构建情感词典
        3.2.4 算法描述
    3.3 本章小结
第4章 基于Word2Vec和改进互信息的多分类情感分析
    4.1 引言
    4.2 算法描述
        4.2.1 融合Word2Vec和改进互信息模型
    4.3 情感词典的扩充
    4.4 本章总结
第5章 实验与分析
    5.1 数据介绍及预处理
        5.1.1 数据介绍
        5.1.2 数据预处理
    5.2 评价指标
    5.3 基线方法
    5.4 实验分析
        5.4.1 SS&W2V-LPA算法在真实数据集的结果与分析
        5.4.2 WP-LPA算法在真实数据集的结果与分析
    5.6 本章总结
第6章 总结与展望
    6.1 全文总结
    6.2 工作展望
参考文献
致谢
攻读硕士学位期间从事的科研工作及取得的成果



本文编号:3116377

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3116377.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c32df***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com