当前位置:主页 > 管理论文 > 移动网络论文 >

基于多方法融合的中文微博情感倾向性分析研究

发布时间:2020-07-05 09:44
【摘要】:针对微博(MicroBlog)的情感分析是目前社交网络舆情研究的热点之一,其将会带来很大的社会和商业价值。微博的语言特点是文本简短,网络新词较多,现有的中文分词系统对Web新词的识别能力不强,导致一些文本的分词结果精度不高,对后续情感分析工作的质量产生影响。另外目前的微博情感分析通常不考虑主题相关性,一个原因是由于微博文本存在内容发散的特点,要进行主题聚类较为困难。除此之外,传统情感词典不足以对日新月异的新情感特征做出极性判断。同时,目前的情感分类集中于粗粒度层面上,很少将其进一步细分,一般的机器学习方法也难以针对细粒度情感做出较高效的分类。为应对以上难题,本文创新的提出“两阶段、四步骤、多方法”的融合策略,首先将研究工作分成情感特征构建和情感特征处理两大阶段,在第一个阶段中设计面向Web新词的中文分词优化和微博情感词典构建两个步骤,第二个阶段设计了主题聚类和细粒度情感分类两个步骤,同时在每个步骤中都结合了多种研究方法以达到针对中文微博主题相关的情感倾向研究的较好效果。创新点及主要策略概述如下:1)针对微博语言特点,提出一种结合统计与规则的方法进行新词发现,并以此进一步实现面向Web的中文分词系统优化;2)面向微博的情感词典构建,基于HowNet算法在情感种子词的基础上通过计算语义相似度构建基础情感词词典,同时基于点互信息算法对Web新词进行情感值标注,并且收录了微博表情语言;3)提出一种基于LDA的主题-情感联合模型,对微博海量数据中的隐含话题进行建模,解决文本稀疏带来的高维问题,同时可以捕捉主题的局部情感程度;4)基于决策树和随机森林模型对情感特征进行训练,以得到细粒度的情感倾向分类结果。经过多组实验后的结果表明,通过本文的方法策略,能够在海量的中文微博数据中,较准确、高效的分析主题相关的细粒度情感倾向。
【学位授予单位】:北方工业大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP393.092;TP391.1

【相似文献】

相关期刊论文 前10条

1 郭飞飞;王小华;谌志群;王荣波;;基于回应消息的中文微博情感分类方法[J];杭州电子科技大学学报;2013年06期

2 李赫元;俞晓明;刘悦;程学旗;程工;;中文微博客的垃圾用户检测[J];中文信息学报;2014年03期

3 文坤梅;徐帅;李瑞轩;辜希武;李玉华;;微博及中文微博信息处理研究综述[J];中文信息学报;2012年06期

4 王银;吴新玲;;中文微博情感分析方法研究[J];广东技术师范学院学报;2014年03期

5 肖s

本文编号:2742439


资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2742439.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户54aff***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com