面向网络敏感信息的主题识别及其情感分析技术研究

发布时间:2024-07-05 02:39
  随着网络和互联网设备的快速发展,人们访问互联网信息的方式正在从被动接受转变为主动创建和分享。网络的开放性、便捷性使得越来越多的网络用户选择在网络上发布一些信息,或表达看法,或仅仅宣泄一种情绪。这些信息在舆论的形成和传播中起着重要作用,也存在一定的潜在安全威胁。因此,如何在大量网络文本中挖掘潜在主题及对人们所发表文本的情感倾向进行分析是一个很有研究价值的课题。本文将针对网络文本进行以下研究:1)针对目前主题识别模型对一些带有敏感倾向性的词汇或领域词汇识别率不高、生成的主题词不准确等问题,本文提出了一种基于Key word weighted-LDA模型的网络文本信息主题识别模型。该模型将构建的关键词词表嵌入到LDA主题模型中,以改善LDA模型对敏感倾向词汇或领域词汇的语义理解和识别能力,提升生成的主题词质量,另一方面也可以提高主题词与相关主题的关联度,发现更多细粒度主题词。实验结果表明,Key word weighted-LDA模型可以有效提升关键词的识别数量和质量,提升主题识别能力。2)网络文本情感分析研究。本文的情感分析任务在特定主题下进行,基于此,本文提出了一种融合主题语义信息的文本...

【文章页数】:68 页

【学位级别】:硕士

【部分图文】:

图1-1本文主要研究内容??可以概括为以下两个方面:??1)对主题识别技术进行深入研究,提出了基于KeyWordweighted-LDA模型的网络??

图1-1本文主要研究内容??可以概括为以下两个方面:??1)对主题识别技术进行深入研究,提出了基于KeyWordweighted-LDA模型的网络??

1.3本文主要研究内容??本文主要研宄对象是网络新闻文本,对网络新闻文本中所包含的隐含主题进行识别,??进而对主题下的评论文本进行情感倾向性分析。本文总体研究内容如图1-1所示。??|?.?I?:??主题识别?i?i?情感分析??1?1??|?\?^?\?I?/?\?!??|?I....


图2-2?LDA的图形模型表示??图中的框线表示内部是可重复的过程,外部的框线表示文档,内部的框线表示文档??

图2-2?LDA的图形模型表示??图中的框线表示内部是可重复的过程,外部的框线表示文档,内部的框线表示文档??

CBOW模型示意图?Skip-Gram模型示意图??图2-1?CBOW和Skip-Gram模型示意图??CBOW模型和Skip-gram模型都包括输入层、投影层和输出层。CBOW模型是基于上??下文的分布对目标词进行预测,对于词w(A:),其上下文为其前后的各(个特征词:??co....


图2-3包含四个层的CNN模型??

图2-3包含四个层的CNN模型??

@?r-Q--|???桃人]?丨以[i,j??图2-2?LDA的图形模型表示??图中的框线表示内部是可重复的过程,外部的框线表示文档,内部的框线表示文档??中主题和特征词的重复选择过程。??2.3深度学习相关理论??深度学习己成为一种强大的机器学习技术,其可以学习数据的多层表示或....


图2-4基础RNN模型??

图2-4基础RNN模型??

行卷积?输出??图2-3包含四个层的CNN模型??每层的表7JK为:??输入层(Inputlayer):长度为n的句子表不为:??xb,?=?X】十x2十…十xn?(2-5)??其中,x1:?表示词:^至七的连接,jc,.?表示第i个词的词向量,词向量维度为d,??十表示连接运算....



本文编号:4000915

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/4000915.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c8f0c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com