当前位置:主页 > 科技论文 > 自动化论文 >

基于强化学习的文本情感分析算法研究

发布时间:2020-03-25 20:09
【摘要】:随着互联网的普及,人们更频繁的参与到互联网中,同时产生了大量用户原创内容(User Generated Content,UGC)数据。随着计算机相关技术的发展,对于UGC数据的情感分类展现了较大的商业价值和学术价值。作为机器学习算法的一个重要分支,强化学习算法更好地模仿了人类的认知和学习过程,然而强化学习算法在分类任务中的研究较少。基于此背景,本文针对强化学习算法与文本情感分析任务进行研究。本文分析了多个UGC数据集,实现一套完整的文本预处理流程;调研并使用词向量和主题模型作为文本表示,以更好的抽取文本特征;充分利用人类的先验知识,构建情感因子词典并用于模型的训练和验证。本文提出了一个新的强化学习模型——WS-LSTM。通过模拟人类认知方式,将文本情感分析抽象为读入词语并获得情感波动的过程。通过构建动作选择层和动作评价层结构,将强化学习算法引入文本情感分类任务。通过构建状态层和全连接层,实现强化学习和有监督学习的统一。利用情感分析结果作为回报,实现模型参数的训练。本文在多个数据集上实验WS-LSTM并验证了其有效性。针对模型中词语的情感动作选择问题,本文改进了ε-贪心算法,引入情感因子使其更加适用。实验结果证明,该算法可以帮助模型选择符合先验知识的词语情感,进而实现模型效果的提升。针对词语级情感分析结果的评测问题,本文利用词语的情感强度,设计出一套新的词语级情感分析结果评价方案,并且使用模型的实验结果对该方案进行了有效性论证。通过该方案的使用,可以实现对词语级实验结果的效果论证。
【图文】:

模型图,模型,语言模型,向量


woremeng,,用词向量(word邋vector)进行表述。该方法最早由Hinton在1986年基本思想是通过训练将每个词映射成K维实数向量。其产生的向量具点:维度较低而且固定,一般为几十到几百维;区别于One-hot和词袋向量存在大量的0,词嵌入中每一维都有一定的取值,取值可正可负。词每一维都代表了一个隐藏的特征,因此可以根据向量间的距离来衡量词似度。逡逑向量的训练方法各有不同,但大部分都是在训练语言模型的同时得到词engio等人使用了一个三层的神经网络来构建语言模型,同时得到了词向[27]。Mikolov则通过使用循环神经网络来降低语言模型参数个数,从而得能提升t28]。逡逑目前常用的词向量训练框架Word2vec工具由Google在2013年开源,该用深度学习的思想,,包含两种不同的方法:ContinuousBagofWords(CBOkip-gram^其中,CBOW根据上下文来预测当前词语的概率;相反Skip-gr据当前词语来预测上下文的概率[29\逡逑INPUT邋PROJECTION邋OUTPUT逦INPUT邋PROJECTION邋OUTPUT逡逑

主题,横坐标轴,激活函数,神经元


CBOW逦Skip-gram逡逑图2-邋1词向量模型——CBOW和Skip-gram[29]逡逑(3)主题模型逡逑主题模型最早由Blei等人提出,他们同时提出了潜在狄利克雷分配(Latent逡逑Dirichletallocaticm,简称LDA)方法进行模型的训练,因此主题模型有时也被称逡逑作LDA[3°]。该方法的思想和词袋模型类似,将文档看作是词的集合,忽视了词逡逑语顺序造成的影响。但是在词袋模型基础上,LDA模型认为文档级中存在若干逡逑个潜在的主题,每一个文档都包含其中的多个主题,同时文档中的所有词语都与逡逑每个主题存在一定的联系。逡逑7逡逑
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.1;TP18

【相似文献】

相关期刊论文 前10条

1 董春利;王莉;;基于粒子滤波的强化学习算法建模研究[J];无线互联科技;2017年01期

2 董春利;王莉;;基于粒子滤波的直接策略搜索强化学习算法研究[J];江苏科技信息;2017年07期

3 谢光强;陈学松;;一种新的基于蚁群优化的模糊强化学习算法[J];计算机应用研究;2011年04期

4 郭城;;面向交通信号控制的改进强化学习算法[J];电脑迷;2017年03期

5 黄金红;周晓阳;;基于有限理性的期望强化学习算法在电力市场中的应用[J];应用数学;2007年S1期

6 董春利;王莉;;基于粒子滤波的强化学习算法研究[J];无线互联科技;2016年15期

7 黄浩晖;杨宛璐;陈玮;;基于性能势的A*平均奖赏强化学习算法研究[J];计算机仿真;2014年07期

8 郑宇;罗四维;吕子昂;;基于模型的层次化强化学习算法[J];北京交通大学学报;2006年05期

9 李春贵;多步截断优先扫描强化学习算法[J];计算机工程;2005年11期

10 杨旭东;刘全;李瑾;;一种基于资格迹的并行强化学习算法[J];苏州大学学报(自然科学版);2012年01期

相关会议论文 前3条

1 陈宗海;段家庆;任皴;罗杨宇;李成荣;;针对机器人觅食任务的强化学习算法及其仿真研究[A];'2008系统仿真技术及其应用学术会议论文集[C];2008年

2 孟祥萍;苑全德;皮玉珍;;基于量子理论的多Agent系统强化学习研究[A];'2006系统仿真技术及其应用学术交流会论文集[C];2006年

3 任q

本文编号:2600383


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2600383.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户863ab***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com