基于注意力网络的文本情感分析在舆情系统中的应用
发布时间:2021-10-11 09:49
伴随着社交网络及电子商务的普及而带来的是越来越多的评价性文本,不同的用户借此表达个人的情绪,而如何从泛滥的文本中获得有价值的信息成为研究人员的关注热点之一。文本情感分析任务即判断包括评价性文本在内的情感色彩,基于此,使得该任务近年来受到了广泛的关注,大量的学者采用不同的分析方法以获得更高的判断精度,部分企业也将文本情感分析任务应用于舆情分析系统作为数字化战略之一。因此,解决文本情感分析任务并进一步应用具有很大的价值,本文在此基础上进行了深入的研究。近年来,深度学习技术在图像、文本等领域的应用发展迅速,利用深度学习来解决文本情感分析任务引起了相关研究人员的广泛关注。然而,以往的许多方法效果一般,不同语境下需要关注的文本以及上下文之间的交互均没有得到很好的实现,这在一定程度上限制了不同解决方法的有效性。在本文中,我们提出了有效的新方法,以多种注意力网络为主体架构,并在此基础上改进,提出了迭代的多头注意力网络,其性能要优于现存的基线方法。将训练好的分析方法应用于舆情系统,进一步验证该方法的广泛应用性。本文的主要工作和创新点如下:(1)针对当前处理文本级别不够精细的问题,本文从细粒度的分析角度...
【文章来源】:山东师范大学山东省
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
中国网民规模和互联网普及率
山东师范大学硕士学位论文30Accuracy发生变化。根据实验结果,我们将学习率设为5e-5。这一变化也反映了IMAN模型对参数的敏感性,不同的参数设置可能会对实验结果产生很大的影响。另外,我们也修改了dropout等参数的值,结果发生了较大的变化。因此,通过大量实验来选择更适合的参数。图4-2采用不同学习率时的准确率此外,我们还比较了不同学习率下在Restaurant数据集上对应的损失函数的变化,如图4-3所示。图像是根据PyTorch中的TensorBoard生成的图像建模的,其中横轴表示训练迭代的次数。由图4-3可直观的表明损失函数值随着训练过程的不断深入而趋于收敛,当学习率为5e-5时,IMAN在三个数据集上的表现最好。因此,最终将IMAN模型的学习率设为5e-5。图4-3采用不同学习率时的损失函数值
山东师范大学硕士学位论文30Accuracy发生变化。根据实验结果,我们将学习率设为5e-5。这一变化也反映了IMAN模型对参数的敏感性,不同的参数设置可能会对实验结果产生很大的影响。另外,我们也修改了dropout等参数的值,结果发生了较大的变化。因此,通过大量实验来选择更适合的参数。图4-2采用不同学习率时的准确率此外,我们还比较了不同学习率下在Restaurant数据集上对应的损失函数的变化,如图4-3所示。图像是根据PyTorch中的TensorBoard生成的图像建模的,其中横轴表示训练迭代的次数。由图4-3可直观的表明损失函数值随着训练过程的不断深入而趋于收敛,当学习率为5e-5时,IMAN在三个数据集上的表现最好。因此,最终将IMAN模型的学习率设为5e-5。图4-3采用不同学习率时的损失函数值
【参考文献】:
期刊论文
[1]基于二分网络的网络用户评论情感分析[J]. 卢伟聪,徐健. 情报理论与实践. 2018(02)
[2]基于深度学习神经网络技术的数字电视监测平台告警模型的研究[J]. 韦坚,刘爱娟,唐剑文. 有线电视技术. 2017(07)
[3]面向在线评论的比较观点挖掘研究综述[J]. 高松,王洪伟,冯罡,王伟. 现代图书情报技术. 2016(10)
[4]中文微博情感词典构建方法[J]. 周咏梅,阳爱民,林江豪. 山东大学学报(工学版). 2014(03)
[5]文本情感分析[J]. 赵妍妍,秦兵,刘挺. 软件学报. 2010(08)
本文编号:3430274
【文章来源】:山东师范大学山东省
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
中国网民规模和互联网普及率
山东师范大学硕士学位论文30Accuracy发生变化。根据实验结果,我们将学习率设为5e-5。这一变化也反映了IMAN模型对参数的敏感性,不同的参数设置可能会对实验结果产生很大的影响。另外,我们也修改了dropout等参数的值,结果发生了较大的变化。因此,通过大量实验来选择更适合的参数。图4-2采用不同学习率时的准确率此外,我们还比较了不同学习率下在Restaurant数据集上对应的损失函数的变化,如图4-3所示。图像是根据PyTorch中的TensorBoard生成的图像建模的,其中横轴表示训练迭代的次数。由图4-3可直观的表明损失函数值随着训练过程的不断深入而趋于收敛,当学习率为5e-5时,IMAN在三个数据集上的表现最好。因此,最终将IMAN模型的学习率设为5e-5。图4-3采用不同学习率时的损失函数值
山东师范大学硕士学位论文30Accuracy发生变化。根据实验结果,我们将学习率设为5e-5。这一变化也反映了IMAN模型对参数的敏感性,不同的参数设置可能会对实验结果产生很大的影响。另外,我们也修改了dropout等参数的值,结果发生了较大的变化。因此,通过大量实验来选择更适合的参数。图4-2采用不同学习率时的准确率此外,我们还比较了不同学习率下在Restaurant数据集上对应的损失函数的变化,如图4-3所示。图像是根据PyTorch中的TensorBoard生成的图像建模的,其中横轴表示训练迭代的次数。由图4-3可直观的表明损失函数值随着训练过程的不断深入而趋于收敛,当学习率为5e-5时,IMAN在三个数据集上的表现最好。因此,最终将IMAN模型的学习率设为5e-5。图4-3采用不同学习率时的损失函数值
【参考文献】:
期刊论文
[1]基于二分网络的网络用户评论情感分析[J]. 卢伟聪,徐健. 情报理论与实践. 2018(02)
[2]基于深度学习神经网络技术的数字电视监测平台告警模型的研究[J]. 韦坚,刘爱娟,唐剑文. 有线电视技术. 2017(07)
[3]面向在线评论的比较观点挖掘研究综述[J]. 高松,王洪伟,冯罡,王伟. 现代图书情报技术. 2016(10)
[4]中文微博情感词典构建方法[J]. 周咏梅,阳爱民,林江豪. 山东大学学报(工学版). 2014(03)
[5]文本情感分析[J]. 赵妍妍,秦兵,刘挺. 软件学报. 2010(08)
本文编号:3430274
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3430274.html
最近更新
教材专著