当前位置:主页 > 理工论文 > 轻工业论文 >

基于Bi-LSTM的在线西藏旅游和饮食评论情感分析研究

发布时间:2021-11-04 13:01
  随着现代化技术的迅速发展,互联网已成为实现人们进行交流的最重要的一个途径。越来越多的互联网用户通过网络的途径来表达自己的观点和对周边发生事情的看法。例如用户从网络平台购买产品,并表达对产品的看法,或者政府发布一些政策,人们也可以通过网络来表达自己的观点。通过将这些数据收集、分析,获取民众的情感倾向性,这些情感倾向性数据有利于商家更好的去分配商品在市场上的比例,政府可以依据这些数据的合法性,去进一步完善政策内容并满足民众的实际需求。因此,研究文本的情感分析变得越来越重要。目前,情感分析主要应用于舆情分析、商家产品口碑等等方面。西藏作为中国著名的旅游胜地,每年都有很多来自中国内地的游客来西藏游玩以及品尝西藏本地的美食,因此研究内地游客对其旅游景点以及当地的饮食评价的情感分析是非常有价值的。深度学习是学习数据之间的关联性,并将这些信息应用到研究任务中,这些学习获取到的信息能够很好应用于语音、文字和图像等领域。目前深度学习方法在自然语言处理方面取得了非常不错的成果,因而受到越来越多人的青睐。相较于传统情感分析过于依赖人工建立的情感词典以及人工选择特征的弊端,尤其是大数据时代的来临,需要处理的数... 

【文章来源】:西藏大学西藏自治区 211工程院校

【文章页数】:55 页

【学位级别】:硕士

【部分图文】:

基于Bi-LSTM的在线西藏旅游和饮食评论情感分析研究


CBOW结构图

示意图,原理,示意图,超平面


12想是一个样本的K个最相邻的样本大多属于某一类,则该样本也属于这一类。就是通过计算与各个样本之间的距离,并取K个距离最近的样本,然后统计这K个样本中的类别,类别最多的即为该样本类别。对于二分类问题,K通常取奇数。本次机器学习采用的是SVM算法,将重点介绍。SVM算法最早是由C.Cortes和V.Vapnik等提出的,以结构风险最小化为原则,解决模式识别中二分类问题的机器学习算法[34]。SVM主要是用来处理数据分类,在机器学习中是比较经典的算法之一。通过在样本空间找到一个超平面将所有样本空间的数据能够很好的划分,同时样本空间的数据集与这个超平面的距离最短[35]。SVM分类原理示意图如图2-2所示。图2-2SVM分类原理示意图由SVM原理可知,要找到一个超平面,并且超平面到各个样本的距离最大。由图知超平面方程计算公式如2-3所示:)(bxwxf(2-3)x表示训练的数据,w和b表示参数。设γ为距离,则得到距离公式为2-4和2-5:max(2-4)

结构图,神经网络,结构图,隐藏层


16图2-3循环神经网络结构图循环神经网络主要包括输入层、隐藏层和输出层。由上图可知,隐藏层中添加了一个反馈机制,使得同层神经元是相互连接的。以文本情感分析来说,输入层的输入通常都是单词的词向量,目前常采用Word2vec词向量技术来训练。隐藏层将输入的词向量数据与前一时刻的隐藏状态分别乘以各自的权重再经过激活函数得到这一层的输出,并且作为下一时刻的输出。假设输入为321...,,xxxxXn,隐藏层神经元初始状态为321...,,hhhhHn,t时刻为当前时刻,则t时刻的隐藏状态和输出计算公式分别为2-13和2-14。XHHbWWhhhtxhtt)(1(2-13)HbWOqhqtt)(2-14)其中表示激活函数,表示t时刻的输入向量,表示输入数据的权重,1表示t-1时刻的隐藏状态,表示隐藏状态的权重,表示偏置。由公式可以看出,循环神经网络任一时刻的输出不仅与当前的输入有关,还与之前的“记忆”有关。循环神经网络通过引入“记忆”这一机制,在处理输入为时间序列数据时,有其独特的优越性。但是它也面临着一个严重的问题就是长期依赖,循环神经网络只是短期记忆,无法实现长久的记忆,因为这涉及到梯度消失或者梯度爆炸。为了解决这一问题,本文在下一章将介绍循环神经网络的变体长短期记忆网络(LSTM),通过门机制来进行解决。

【参考文献】:
期刊论文
[1]基于多部情感词典和规则集的中文微博情感分析研究[J]. 吴杰胜,陆奎.  计算机应用与软件. 2019(09)
[2]基于双层注意力循环神经网络的方面级情感分析[J]. 曾锋,曾碧卿,韩旭丽,张敏,商齐.  中文信息学报. 2019(06)
[3]基于双层注意力和Bi-LSTM的公共安全事件微博情感分析[J]. 曾子明,万品玉.  情报科学. 2019(06)
[4]采用循环神经网络的情感分析注意力模型[J]. 李松如,陈锻生.  华侨大学学报(自然科学版). 2018(02)
[5]基于RNTN和CBOW的商品评论情感分类[J]. 彭三春,张云华.  计算机工程与设计. 2018(03)
[6]基于词典与机器学习的藏文微博情感分析研究[J]. 杨志.  软件. 2017(11)
[7]细粒度情感分析研究综述[J]. 唐晓波,刘广超.  图书情报工作. 2017(05)
[8]机器学习与语义规则融合的微博情感分类方法[J]. 姜杰,夏睿.  北京大学学报(自然科学版). 2017(02)
[9]基于极性转移和LSTM递归网络的情感分析[J]. 梁军,柴玉梅,原慧斌,高明磊,昝红英.  中文信息学报. 2015(05)
[10]基于平滑SO-PMI算法的微博情感词典构建方法研究[J]. 杜锐,朱艳辉,田海龙,刘璟,马进.  湖南工业大学学报. 2015(05)

硕士论文
[1]基于深度学习与自注意力机制的情感分类方法研究[D]. 祝元勃.西安理工大学 2019
[2]基于BLSTM的中文短文本情感分析算法研究[D]. 吴小华.西北大学 2019
[3]基于注意力机制及深度学习的文本情感分析研究[D]. 梁宁.华北电力大学 2019
[4]基于CNN和BLSTM特征融合的情感分析研究[D]. 曹雯琳.华中师范大学 2019
[5]基于LSTM和LDA模型的患者情感分析研究[D]. 花树雯.浙江理工大学 2019
[6]基于朴素贝叶斯的中文文本分类及Python实现[D]. 张航.山东师范大学 2018
[7]基于扩展词典和规则的中文微博情感分析[D]. 李继东.北京交通大学 2018
[8]基于LSTM模型的文本情感分析技术的研究[D]. 赵晓伟.华北电力大学 2018
[9]短文本用户评论的分类系统设计与实现[D]. 李军炜.北京邮电大学 2018
[10]基于机器学习的微博情感分析及应用[D]. 张俊东.北京邮电大学 2017



本文编号:3475782

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/qgylw/3475782.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0b7b0***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com