当前位置:主页 > 科技论文 > 软件论文 >

基于TH-LDA模型的中文微博热点事件检测及情感分析

发布时间:2018-04-02 13:10

  本文选题:微博 切入点:热点事件 出处:《西南大学》2017年硕士论文


【摘要】:在微博平台上,涉及生活、人际交往等各种信息以前所未有的速度增长,并呈几何级增长式传播。社会上许多突发性话题,往往在微博平台上首发,并快速传播,迅速成为热点,引起广泛的社会共鸣,进而波及传统媒体,产生巨大的社会影响。微博平台上的热点事件检测技术,对于最新社会热点发现、网络民意及时感知、舆情检测、应急处理等方面都具有积极的现实意义。用户通过微博平台对热点事件表达自己的观点和抒发自己的情感,互相交流讨论,形成了海量情感文本信息,通过对这些情感文本信息进行分析处理,可以挖掘出其背后隐藏的有价值信息。本文对现有关于微博热点事件检测和情感分析的研究进行分析,指出了微博上进行相关研究所遇到的问题,其一是利用微博标签属性建模来获取热点事件时,对不含标签的微博文本处理和子事件检测问题;其二是微博情感分析中网络流行语获取和其情感极性判定的问题。在此基础上,本文提出了TH-LDA模型来解决微博热点事件检测,基于词典和网络流行语情感极性特征的情感分析方法,研究工作主要包含以下内容:(1)提出了TH-LDA模型,将微博中可用于检测和分析微博文本主题的话题标签(Hashtag)、时间因素(Time)与主题模型LDA相结合,实现热点事件检测,利用此模型对同属于一个热点事件的不含标签的微博文本进行检索,得到更为全面的同一热点事件的微博文本集合,同时实现热点事件中子事件的检测,进而能够更好地对事件的演化发展进行追踪。(2)提出了网络流行语过滤规则(Network Catchwords Filter Rule,简称NCF规则)来构建网络流行语词典和网络流行语情感词典。根据网络流行语词典获取微博文本中的网络流行语,利用网络流行语情感词典对网络流行语的情感极性进行判定。(3)实现微博的情感分析。结合已构建的基础情感词典、表情符号词典和网络流行语情感词典,并融合网络流行语的情感极性特征对微博情感极性进行判定。实验结果表明,TH-LDA模型能够更准确地获取同一事件中不含标签的微博文本信息,实现了热点事件中子事件的检测,也能更好地追踪热点事件演化发展;NCF规则能够构建较完善的网络流行语词典,网络流行语的情感极性特征对微博的情感极性判定起到了很好的矫正作用,实验验证了该方法的有效性。
[Abstract]:On the platform of Weibo, all kinds of information, such as life and interpersonal communication, are growing at an unprecedented speed, and spread in a geometric growth mode.Many sudden social topics often start on the platform of Weibo and spread rapidly, which quickly become a hot spot, and cause widespread social resonance, and then spread to traditional media, which has a huge social impact.The hot spot detection technology on Weibo platform has positive practical significance for the newest social hot spot discovery, the network public opinion timely perception, the public opinion detection, the emergency treatment and so on.Through Weibo platform, users express their views and express their feelings on hot issues, exchange and discuss with each other, forming a vast amount of emotional text information, through the analysis and processing of these emotional text information,You can dig out the valuable information hidden behind it.This paper analyzes the existing research on Weibo hot spot event detection and emotion analysis, and points out the problems encountered in the relevant research on Weibo.This paper deals with the text processing and sub-event detection of Weibo without tags, and the acquisition of network catchwords and the determination of emotional polarity in the affective analysis of Weibo.On this basis, this paper puts forward the TH-LDA model to solve the hot spot event detection of Weibo. Based on the emotional polarity characteristics of dictionaries and network catchwords, the research work mainly includes the following contents: 1) put forward the TH-LDA model.This paper combines Weibo's topic tag, which can be used to detect and analyze the theme of Weibo's text, with the theme model LDA to detect hot events.By using this model, the text of Weibo, which belongs to the same hot event, is retrieved without label, and then a more comprehensive set of Weibo texts of the same hot event is obtained, and the neutron event detection of the hot event is realized at the same time.Furthermore, it can better track the evolution and development of events. (2) this paper puts forward the network Catchwords Filter rule (NCF rule) to construct the network catchword dictionary and the network catchword emotion dictionary.According to the network catchword dictionary to obtain the network catchwords in Weibo's text, the emotion dictionary of network pop language is used to judge the emotional polarity of network buzzwords.Combined with the basic emotion dictionary, emoji dictionary and network pop language dictionary, and combined with the emotional polarity characteristics of the network catchword, Weibo's emotional polarity was judged.The experimental results show that the TH-LDA model can more accurately obtain the text information of Weibo with no label in the same event, and realize the detection of neutron events of hot events.It can also better track the evolution of hot events. NCF rules can build a more perfect dictionary of popular words on the Internet. The emotional polarity characteristics of network catchwords play a good role in correcting Weibo's judgment of emotional polarity.The effectiveness of the method is verified by experiments.
【学位授予单位】:西南大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.1;TP393.092

【参考文献】

相关期刊论文 前10条

1 贺敏;杜攀;张瑾;刘悦;程学旗;;基于动量模型的微博突发话题检测方法[J];计算机研究与发展;2015年05期

2 黄挺;姬东鸿;;基于图模型和多分类器的微博情感倾向性分析[J];计算机工程;2015年04期

3 申国伟;杨武;王巍;于淼;;面向大规模微博消息流的突发话题检测[J];计算机研究与发展;2015年02期

4 李婷婷;姬东鸿;;基于SVM和CRF多特征组合的微博情感分析[J];计算机应用研究;2015年04期

5 曹玖新;吴江林;石伟;刘波;郑啸;罗军舟;;新浪微博网信息传播分析与预测[J];计算机学报;2014年04期

6 王志涛;於志文;郭斌;路新江;;基于词典和规则集的中文微博情感分析[J];计算机工程与应用;2015年08期

7 张珊;于留宝;胡长军;;基于表情图片与情感词的中文微博情感分析[J];计算机科学;2012年S3期

8 张晨逸;孙建伶;丁轶群;;基于MB-LDA模型的微博主题挖掘[J];计算机研究与发展;2011年10期

9 闫幸;常亚平;;微博研究综述[J];情报杂志;2011年09期

10 龙树全;赵正文;唐华;;中文分词算法概述[J];电脑知识与技术;2009年10期

相关博士学位论文 前3条

1 刘楠;面向微博短文本的情感分析研究[D];武汉大学;2013年

2 崔安颀;微博热点事件的公众情感分析研究[D];清华大学;2013年

3 田野;基于微博平台的事件趋势分析及预测研究[D];武汉大学;2012年

相关硕士学位论文 前3条

1 高岩;微博情感分析的相关技术研究[D];华北电力大学;2014年

2 樊小超;基于机器学习的中文文本主题分类及情感分类研究[D];南京理工大学;2014年

3 蒋斌;基于停用词处理的汉语语音检索方法[D];哈尔滨工业大学;2008年



本文编号:1700528

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1700528.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0d6c7***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com