基于深度学习的中文微博情感分析研究
发布时间:2020-12-25 17:59
随着信息化时代的到来,互联网使用人数越来越多,数据成为商业活动中一种重要的资源,海量的数据存在着大量有价值的信息。微博,作为一种新的社交媒体已被大众广泛接受。在内容方面,微博涉及的话题丰富多样、参与度高;从用户角度上分析,微博可以满足用户的个性化要求,实时沟通交流与情感倾诉。微博传播信息的能力十分强大,每天都产生海量的数据。通过对中文微博进行情感分析研究,能在网络舆情监测、商品市场营销、方针政策意见反馈等方面发挥极大的作用。目前,已有的情感分析研究大多基于传统机器学习的方法和基于规则词典的方法,存在诸多的不足,例如标注代价过高和移植性较差等。且中文微博具有篇幅短小、语法特殊、词汇新颖等特点,已有的方法不能很好地处理微博数据。为解决上述问题,本文将使用深度学习的方法,分别从情感评价对象抽取和情感分类两个方面展开研究,具体如下:1.提出了一种基于长短时记忆网络的中文微博情感评价对象抽取方法。方法首先通过构建双向长短时记忆网络模型,将评价对象抽取任务转化为序列标注任务;再利用注意力机制,计算注意力分配概率分布,提高序列的表达能力;最后结合机器学习方法中的条件随机场算法规划文本序列的最优标注路...
【文章来源】:重庆邮电大学重庆市
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
CRF和LSTM的对比实验结果;
图 3.2 CRF 和 LSTM 的对比实验结果 可以看出 CRF 方法的实验结果中准确率和召回率均比较低,,F1 值为 47.5%。召回率偏低的原因主要是因为是 CRF 学习求抽取的对象较为复杂、前后跨度较大时便会有所不足,会整,当评价对象是由多个字组成的长词语时,抽取的结果可成的词语,并不完整,从而降低准确率和召回率,影响模型TM 模型在准确率和召回率方面得到的值分别为 62.5%和 45.准确率和召回率均优于 CRF,增益为 3.9%和 5.4%。主要因,虽然实验的语料都存在评价对象复杂和前后跨度大的问适应解决长期依赖的问题,通过门结构能够获得到跨度较大利用上下文信息决定当前单元值的输出,相较于 CRF 的局部完整的情感对象,获得的结果更好。
图 3.3 LSTM 和双向 LSTM 的对比实验结果以看出双向 LSTM 的准确率和召回率两方面均略优于单 46.6%,增益为 0.6%和 1.2%。单向 LSTM 只能利用文本的状态,双向 LSTM 模型通过实现两个方向相反的 LS史的上下文的特征信息,而反向 LSTM 捕获了未来的上 LSTM 能获取更多的上下文特征信息,可以同时利用双前值进行计算,所以在准确率和召回率方面均有所提高型和融合模型的对比实验
【参考文献】:
期刊论文
[1]结合词性特征与卷积神经网络的文本情感分析[J]. 何鸿业,郑瑾,张祖平. 计算机工程. 2018(11)
[2]基于AWCRF模型的微博情感倾向分类方法[J]. 陈炳丰,郝志峰,蔡瑞初,温雯,梁礼欣. 计算机工程. 2017(07)
[3]卷积神经网络研究综述[J]. 周飞燕,金林鹏,董军. 计算机学报. 2017(06)
[4]基于分类关联规则的微博情绪分析[J]. 刘思,朱福喜,阳小兰,刘世超. 计算机工程与设计. 2016(12)
[5]用于微博情感分析的一种情感语义增强的深度学习模型[J]. 何炎祥,孙松涛,牛菲菲,李飞. 计算机学报. 2017(04)
[6]基于长短期记忆多维主题情感倾向性分析模型[J]. 滕飞,郑超美,李文. 计算机应用. 2016(08)
[7]基于CRFs和领域本体的中文微博评价对象抽取研究[J]. 丁晟春,吴婧婵媛,李霄. 中文信息学报. 2016(04)
[8]基于语义分析的评价对象-情感词对抽取[J]. 江腾蛟,万常选,刘德喜,刘喜平,廖国琼. 计算机学报. 2017(03)
[9]基于多特征融合的中文微博评价对象抽取方法[J]. 李景玉,张仰森,蒋玉茹. 计算机应用研究. 2016(02)
[10]基于神经网络的微博情感分析[J]. 苏小英,孟环建. 计算机技术与发展. 2015(12)
硕士论文
[1]基于深度学习的文本情感分类研究[D]. 朱少杰.哈尔滨工业大学 2014
本文编号:2938130
【文章来源】:重庆邮电大学重庆市
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
CRF和LSTM的对比实验结果;
图 3.2 CRF 和 LSTM 的对比实验结果 可以看出 CRF 方法的实验结果中准确率和召回率均比较低,,F1 值为 47.5%。召回率偏低的原因主要是因为是 CRF 学习求抽取的对象较为复杂、前后跨度较大时便会有所不足,会整,当评价对象是由多个字组成的长词语时,抽取的结果可成的词语,并不完整,从而降低准确率和召回率,影响模型TM 模型在准确率和召回率方面得到的值分别为 62.5%和 45.准确率和召回率均优于 CRF,增益为 3.9%和 5.4%。主要因,虽然实验的语料都存在评价对象复杂和前后跨度大的问适应解决长期依赖的问题,通过门结构能够获得到跨度较大利用上下文信息决定当前单元值的输出,相较于 CRF 的局部完整的情感对象,获得的结果更好。
图 3.3 LSTM 和双向 LSTM 的对比实验结果以看出双向 LSTM 的准确率和召回率两方面均略优于单 46.6%,增益为 0.6%和 1.2%。单向 LSTM 只能利用文本的状态,双向 LSTM 模型通过实现两个方向相反的 LS史的上下文的特征信息,而反向 LSTM 捕获了未来的上 LSTM 能获取更多的上下文特征信息,可以同时利用双前值进行计算,所以在准确率和召回率方面均有所提高型和融合模型的对比实验
【参考文献】:
期刊论文
[1]结合词性特征与卷积神经网络的文本情感分析[J]. 何鸿业,郑瑾,张祖平. 计算机工程. 2018(11)
[2]基于AWCRF模型的微博情感倾向分类方法[J]. 陈炳丰,郝志峰,蔡瑞初,温雯,梁礼欣. 计算机工程. 2017(07)
[3]卷积神经网络研究综述[J]. 周飞燕,金林鹏,董军. 计算机学报. 2017(06)
[4]基于分类关联规则的微博情绪分析[J]. 刘思,朱福喜,阳小兰,刘世超. 计算机工程与设计. 2016(12)
[5]用于微博情感分析的一种情感语义增强的深度学习模型[J]. 何炎祥,孙松涛,牛菲菲,李飞. 计算机学报. 2017(04)
[6]基于长短期记忆多维主题情感倾向性分析模型[J]. 滕飞,郑超美,李文. 计算机应用. 2016(08)
[7]基于CRFs和领域本体的中文微博评价对象抽取研究[J]. 丁晟春,吴婧婵媛,李霄. 中文信息学报. 2016(04)
[8]基于语义分析的评价对象-情感词对抽取[J]. 江腾蛟,万常选,刘德喜,刘喜平,廖国琼. 计算机学报. 2017(03)
[9]基于多特征融合的中文微博评价对象抽取方法[J]. 李景玉,张仰森,蒋玉茹. 计算机应用研究. 2016(02)
[10]基于神经网络的微博情感分析[J]. 苏小英,孟环建. 计算机技术与发展. 2015(12)
硕士论文
[1]基于深度学习的文本情感分类研究[D]. 朱少杰.哈尔滨工业大学 2014
本文编号:2938130
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2938130.html