基于卷积神经网络的短文本情感分类研究
发布时间:2024-06-29 21:20
文本情感分类是自然语言研究领域中的重要课题,目前对于文本情感分类研究多是基于情感词典和机器学习方法的,但它们在完成情感分类任务时割裂了文本中各词语间的关系,忽略了词语在上下文中的含义,无法捕捉到文本的深层语义信息,对于表达不规范的网络短文本的情感分析准确性更是有待提高。近年来,基于深度学习方法的研究日益加深,各学者也通过使用深度学习技术在自然语言研究领域中取得了众多突破。因此,本文提出使用深度学习方法对网络平台上的中文短文本进行情感类别判定,主要研究工作如下:(1)针对带有情感类别标注的中文数据集较少问题,本文采用编写爬虫程序的方式从京东商城官网上共爬取了 25000条评论文本,同时也利用word2vec工具在中文公共语料库的基础上训练出各词语的语义向量以解决情感分类实验时如何将文本数据数值化的问题。(2)针对文本表示问题,本文分别使用以tf-idf来表示特征权重的向量空间模型和word2vec训练的词向量模型来构造传统机器学习模型实验时的文本数据,通过分析实验结果发现,考虑了上下文含义的word2vec词向量更能让模型学习到文本中的情感信息,使其分类性能得以提升。但是提升程度有限,始...
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
本文编号:3997907
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
图2.4支持向最和间隔??
要找到满足式子2-?(13)的最小|丨w||2,就可以获得最优超面。用公式表示的SVM如式??2-?(15)所示。??min?丄?||vv|丨2??.?22-?(15)??sJ.y:?i^v'x:?+?A?j?>?1,/?=??以上计算都是基于数据样本是线性可分情况下的,对于非线....
图2.5?KNN分类示意图??
?浙江理工大学硕士学位论文???公式2-?(16)分别进行汁算:??n??1Lxjxxu??4)二.7-1?2-?(16)??V?M?y=i??根据式子2-?(16)计算的结果,从中选取最为相似的K个文本并根倨式r?2-?(17)分别计??算出这k个文本属r类別&的权?值,m后将....
图2.6生物神经元结构??
?浙江理工大学硕士学位论文???为了更好的了解其原理,将先介绍人工祌经网络的相关知识。??(1)人工神经网络??人工祌经网络(Artificial?Neural?Network,?ANN)简称为神经网络,足一种模拟生物神??经网络信息处理机制的数学模型,由不同的神经元(或者称为节....
图2.7人工神经元结构??
?浙江理工大学硕士学位论文???为了更好的了解其原理,将先介绍人工祌经网络的相关知识。??(1)人工神经网络??人工祌经网络(Artificial?Neural?Network,?ANN)简称为神经网络,足一种模拟生物神??经网络信息处理机制的数学模型,由不同的神经元(或者称为节....
本文编号:3997907
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3997907.html
最近更新
教材专著