基于深度学习的跨语言文本情感分类技术研究
发布时间:2024-12-21 07:50
随着互联网技术的飞速发展,人们越来越热衷于在网上发表自己对某一事件或者事物的看法,这些评论背后隐藏着巨大的商业价值,所以近年来文本情感分析越来越引起人们的关注。但是一些语言较其他语言起步晚,缺乏高质量的语料资源,人工标注又需要投入巨大的人力物力资源,这在一定程度上阻碍了其文本情感分类技术的研究。跨语言文本情感分类任务就是利用语料资源丰富的一种语言,辅助另一种语料资源匮乏的语言实现文本情感分类。为了进一步提高跨语言文本情感的分类性能,本文做了多方面的融合和改进,提出了以下跨语言文本情感分类方法:(1)针对传统的单语言词向量表示方法不能很好地进行双语交互学习这一问题,提出了一种对抗长短时记忆网络的跨语言文本情感分类方法。该方法设置源语言和目标语言独立的特征提取网络以及双语共享特征提取网络,建立源语言和目标语言的联系,减少双语之间的语义鸿沟。同时,在共享特征提取网络中,设置语言分类器进行对抗训练,使分类器尽可能分不清特征是来自源语言还是目标语言,以获得双语的不变特征,从而使双语之间达到更好的知识迁移效果。相比较之前的研究方法,这种方法既保留了双语各自独立的特征,又可以获取到双语的不变特征。在N...
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
本文编号:4018653
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
图2.1支持向量与间隔
支持向量机的应用很广泛,应用的领域不同,优化的方法也不尽相同。根据实际所研究的内容,将该方法与实际任务结合,许多学者还在不断的进行着相应的探索[51][52]。2.2.2.2朴素贝叶斯
图2.2 LSTM单元结构
为了应对这个问题,研究人员提出了许多解决办法[66][67]。而长短时记忆网络就是其中比较著名且应用最广泛的一种,长短时记忆算法最早由Hochreiter于1997年提出[68]。LSTM通过增加门机制以及记忆单元,使得自循环的权重在训练期间不断变化,从而有效地解决了上述问题。L....
图3.1 Encoder-Decoder模型结构图
若给定源语句source=(x1,x2,...,xm),则编码器Encoder会对源语句进行编码。然后,通过非线性变化转化为中间语义表示C=F(x1,x2,...,xm)。解码器Decoder根据源语句的中间语义表示C和之前已经生成的历史信息y1,y2,...yi-1生成i时刻要....
图3.2加入Attention机制的Encoder-Decoder模型结构图
其中,表示输入对输出的概率,其代表的信息越重要,分配的权重相应的也会越大。这种对输入进行选择性的学习的做法,避免了大量繁复盲目的学习,提高了模型的学习效率和准确率。3.2.2跨语言文本特征提取网络
本文编号:4018653
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/4018653.html