基于爆发词识别的微博突发事件监测方法研究
本文关键词:基于爆发词识别的微博突发事件监测方法研究
【摘要】:鉴于近年突发事件在微博传播的巨大影响力,提出基于爆发词识别的微博突发事件监测方法。把微博突发事件监测分为微博预处理、爆发词抽取、爆发词聚类三个模块。先提出微博噪声数据过滤规则从海量数据中过滤噪声微博,然后采用相对词频、词频增长率、爆发词权重三个计算指标来提取出爆发词特征,最后采用共词分析方法来实现爆发词聚类,从而提取突发事件。最后以新浪微博数据为例进行实验,验证了提出的算法对突发事件监测能取得不错的效果。
【作者单位】: 南京邮电大学图书馆;南京邮电大学科技情报研究所;
【关键词】: 微博 爆发词 共现分析 突发事件
【分类号】:TP393.092;TP391.1
【正文快照】: 0引言自2006年第一个微博平台twitter使用以来,由于其传播速度快、互动性强、信息更新方便等特点使其作为一种新型的媒体得以在国内外迅速推广,近几年更是随着手机、平板等移动终端的普及,越来越多的人可以随时随地的分享信息,进入了全民媒体时代。与传统媒体相比,事故现场的
【参考文献】
中国期刊全文数据库 前4条
1 王小华;徐宁;谌志群;;基于共词分析的文本主题词聚类与主题发现[J];情报科学;2011年11期
2 逯万辉;马建霞;赵迎光;;爆发词识别与主题探测技术研究综述[J];情报理论与实践;2012年06期
3 逯万辉;马建霞;;基于CRFs的领域爆发词识别的研究与实现[J];情报科学;2014年01期
4 朱晓峰;陈楚楚;尹婵娟;;基于微博舆情监测的K-Means算法改进研究[J];情报理论与实践;2014年01期
【共引文献】
中国期刊全文数据库 前7条
1 谌志群;徐宁;王荣波;;基于主题演化图的网络论坛热点跟踪[J];情报科学;2013年03期
2 王连喜;;微博短文本预处理及学习研究综述[J];图书情报工作;2013年11期
3 逯万辉;马建霞;;基于CRFs的领域爆发词识别的研究与实现[J];情报科学;2014年01期
4 陈国兰;孙国梓;;微博平台监测网络突发事件的关键问题研究[J];情报探索;2014年08期
5 赵文清;侯小可;;基于词共现图的中文微博新闻话题识别[J];智能系统学报;2012年05期
6 张振国;崔荣一;潘红;;基于语义的毕业论文题目相似性分析[J];延边大学学报(自然科学版);2013年02期
7 卜庆丰;;互联网新闻报道中的突发事件识别研究[J];新闻研究导刊;2014年07期
中国博士学位论文全文数据库 前2条
1 王佳;中国医患危机管理体系构建研究[D];吉林大学;2013年
2 王婵;基于Dirichlet过程混合模型的话题识别与追踪[D];北京邮电大学;2013年
中国硕士学位论文全文数据库 前10条
1 王政霄;基于微博的热点事件挖掘与情感分析[D];上海交通大学;2013年
2 邱洋;微博数据提取及话题检测方法研究[D];大连理工大学;2013年
3 孙励;基于微博的热点话题发现[D];北京邮电大学;2013年
4 杨文漪;面向微博的事件检测算法研究[D];北京邮电大学;2013年
5 詹勇;基于主题模型和混合模型的微博客交叉话题发现研究[D];西南交通大学;2013年
6 冯智斌;面向中文文本挖掘的聚类算法研究[D];华南理工大学;2013年
7 张东霞;基于高校学生微博的网络热点发现及舆情分析研究[D];华南理工大学;2013年
8 刘玉新;Web2.0互联网在线话题发现和热度评估[D];华南理工大学;2013年
9 史仁仁;网络舆情话题识别与跟踪系统的研究与实现[D];电子科技大学;2013年
10 王娟;基于本体的微博话题发现与倾向性分析研究[D];河南师范大学;2013年
【二级参考文献】
中国期刊全文数据库 前10条
1 逯万辉;马建霞;赵迎光;;爆发词识别与主题探测技术研究综述[J];情报理论与实践;2012年06期
2 魏晓俊;;基于科技文献中词语的科技发展监测方法研究[J];情报杂志;2007年03期
3 钟伟金;李佳;;共词分析法研究(一)——共词分析的过程与方式[J];情报杂志;2008年05期
4 钟伟金;李佳;杨兴菊;;共词分析法研究(三)——共词聚类分析法的原理与特点[J];情报杂志;2008年07期
5 刘红霞;乔晓东;张运良;;新兴趋势监测指标体系探索[J];情报杂志;2010年S1期
6 高承实;荣星;陈越;;微博舆情监测指标体系研究[J];情报杂志;2011年09期
7 冷伏海;冯璐;;情报研究方法发展现状与趋势[J];图书情报工作;2009年02期
8 史金成;程转流;;基于混合聚类的中文词聚类[J];微计算机信息;2010年15期
9 袁里驰,钟义信;基于相似度的词聚类算法[J];微电子学与计算机;2005年08期
10 崔争艳;;基于语义的微博短信息分类[J];现代计算机(专业版);2010年08期
中国博士学位论文全文数据库 前2条
1 曾庆香;试论新闻话语[D];中国社会科学院研究生院;2003年
2 雷震;基于事件的新闻报道分析技术研究[D];国防科学技术大学;2006年
中国硕士学位论文全文数据库 前3条
1 魏莎莎;一种中文未登录词识别及词典设计新方法[D];西南大学;2011年
2 赵国荣;中文新闻语料中的时间短语识别方法研究[D];山西大学;2006年
3 龚海军;网络热点话题自动发现技术研究[D];华中师范大学;2008年
,本文编号:934029
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/934029.html