基于突发词聚类的微博突发事件检测方法
本文关键词:基于突发词聚类的微博突发事件检测方法
【摘要】:微博突发事件检测是网络舆情分析的重要分支,近年来已受到国内外学者的广泛关注。分析用户行为特征,提出一种用户影响力计算方法,并将其与微博文本特征、传播特征相结合,提出词语突发度概念作为突发词的判定标准,进而抽取突发词集;引入凝聚式层次聚类算法,对突发词集进行聚类,并筛选出合适的突发词类簇用以描述突发事件,从而实现微博突发事件检测。通过实验检测,结果是正确率为63.64%,召回率为87.5%,F值为0.74,表明该方法可以在大量微博数据中有效检测到突发事件。
【作者单位】: 网络文化与数字传播北京市重点实验室(北京信息科技大学);
【关键词】: 突发事件 用户影响力 突发词 聚类
【基金】:国家自然科学基金资助项目(61171159,61271304) 北京市教委科技发展计划重点项目暨北京市自然科学基金资助B类重点项目(KZ201311232037)
【分类号】:TP393.092
【正文快照】: 0引言微博是近年来迅速兴起的网络全民媒体,一个可以方便快捷地发布、分享、获取以及传播信息的平台。国外著名微博服务平台Twitter,自2006年在美国上线以来,其注册用户已超过5亿[1]。而国内的本地化微博服务近几年也在迅速发展,据中国互联网络信息中心(China Internet Networ
【参考文献】
中国期刊全文数据库 前4条
1 郑斐然;苗夺谦;张志飞;高灿;;一种中文微博新闻话题检测的方法[J];计算机科学;2012年01期
2 邱云飞;程亮;;微博突发话题检测方法研究[J];计算机工程;2012年09期
3 周刚;邹鸿程;熊小兵;黄永忠;;MB-SinglePass:基于组合相似度的微博话题检测[J];计算机科学;2012年10期
4 童薇;陈威;孟小峰;;EDM:高效的微博事件检测算法[J];计算机科学与探索;2012年12期
【共引文献】
中国期刊全文数据库 前10条
1 潘大庆;;基于层次聚类的微博敏感话题检测算法研究[J];广西民族大学学报(自然科学版);2012年04期
2 冯如晓;刘志明;雷龙艳;;基于搜索引擎的关键词舆情过滤算法研究[J];电脑知识与技术;2014年06期
3 程亮;邱云飞;孙鲁;;微博谣言检测方法研究[J];计算机应用与软件;2013年02期
4 方明;方意;;一种新型智能僵尸粉甄别方法[J];计算机工程;2013年04期
5 邱泉清;苗夺谦;张志飞;;中文微博命名实体识别[J];计算机科学;2013年06期
6 张宗福;;一种基于LCS的微博相似页面检测方法[J];集成技术;2013年03期
7 张志飞;苗夺谦;高灿;;基于LDA主题模型的短文本分类方法[J];计算机应用;2013年06期
8 薛素芝;鲁燃;任圆圆;;基于速度增长的微博热点话题发现[J];计算机应用研究;2013年09期
9 王跟成;李军;;基于离群点剔除的网络热点事件挖掘算法[J];计算机仿真;2013年09期
10 杨武;李阳;卢玲;;基于用户角色定位的微博热点话题检测方法[J];计算机应用;2013年11期
中国重要会议论文全文数据库 前1条
1 朱浩然;梁循;马跃峰;纪阳;李启东;马超;;金融领域中文微博情感分析[A];第八届(2013)中国管理学年会论文集(选编)[C];2013年
中国博士学位论文全文数据库 前2条
1 王婵;基于Dirichlet过程混合模型的话题识别与追踪[D];北京邮电大学;2013年
2 刘楠;面向微博短文本的情感分析研究[D];武汉大学;2013年
中国硕士学位论文全文数据库 前10条
1 麦艺华;面向中文微博的社会网络分析及应用[D];华南理工大学;2012年
2 谢婧;中文微博的话题检测及微博预警[D];上海交通大学;2013年
3 王政霄;基于微博的热点事件挖掘与情感分析[D];上海交通大学;2013年
4 邱洋;微博数据提取及话题检测方法研究[D];大连理工大学;2013年
5 王熙;基于用户关系分析和微博内容挖掘的信息推荐系统研究[D];北京邮电大学;2013年
6 杨文漪;面向微博的事件检测算法研究[D];北京邮电大学;2013年
7 詹勇;基于主题模型和混合模型的微博客交叉话题发现研究[D];西南交通大学;2013年
8 杨小玲;基于新浪微博的企业实体关系抽取[D];华东师范大学;2013年
9 张志飞;微博信息流中突现话题检测技术研究[D];杭州电子科技大学;2012年
10 黄振龙;关于微博热点的WEB挖掘研究[D];华东师范大学;2013年
【二级参考文献】
中国期刊全文数据库 前10条
1 贾自艳 ,何清 ,张海俊 ,李嘉佑 ,史忠植;一种基于动态进化模型的事件探测和追踪算法[J];计算机研究与发展;2004年07期
2 徐建民;唐万生;;基于查询术语同义词的扩展信念网络检索模型[J];计算机工程;2007年10期
3 张震;汪斌强;陈庶樵;周粳迪;;基于滑动窗口的资源可控流量测量算法[J];计算机工程;2010年03期
4 席耀一;林琛;李弼程;周杰;许旭阳;;基于语义相似度的论坛话题追踪方法[J];计算机应用;2011年01期
5 张晓艳;王挺;;话题发现与追踪技术研究[J];计算机科学与探索;2009年04期
6 洪宇;张宇;刘挺;李生;;话题检测与跟踪的评测及研究综述[J];中文信息学报;2007年06期
7 曹鹏;李静远;满彤;刘悦;程学旗;;Twitter中近似重复消息的判定方法研究[J];中文信息学报;2011年01期
8 任姚鹏;陈立潮;张英俊;袁英;;结合语义的特征权重计算方法研究[J];计算机工程与设计;2010年10期
9 崔争艳;;基于语义的微博短信息分类[J];现代计算机(专业版);2010年08期
10 蔡晓婷;;突发性事件中的微博客传播[J];新闻爱好者;2010年11期
中国硕士学位论文全文数据库 前1条
1 孙胜平;中文微博客热点话题检测与跟踪技术研究[D];北京交通大学;2011年
【相似文献】
中国期刊全文数据库 前10条
1 刘宏;;浅谈网络安全应急响应[J];科技资讯;2007年20期
2 杜建民;;信息网络安全事件的防范和应急处置[J];中国公共安全(学术版);2009年03期
3 李季梅;陈宁;陈安;武艳南;;突发事件的网络舆情监测与恐慌度量系统[J];中国科技资源导刊;2009年02期
4 王艳灵;王恒山;;超网络上突发事件的信息传播模式构建[J];灾害学;2011年04期
5 王金云;;处理信息安全突发事件的多Agent分布式协同管理机制[J];微计算机信息;2005年26期
6 郑魁;疏学明;袁宏永;;网络舆情热点信息自动发现方法[J];计算机工程;2010年03期
7 郑魁;疏学明;袁宏永;金思魁;;突发事件网络舆情信息分类方法研究[J];计算机应用与软件;2010年05期
8 刘志明;刘鲁;;面向突发事件的群体情绪监控预警[J];系统工程;2010年07期
9 黄锋;;高校校园网信息安全突发事件危机预防中存在的问题及其对策研究[J];咸宁学院学报;2010年09期
10 ;网络安全应急、处理突发事件和保障的解决方案[J];计算机安全;2002年11期
中国重要会议论文全文数据库 前3条
1 程莹;宋蕾;孙健;韩伟杰;;可生存性网络研究[A];全国ISNBM学术交流会暨电脑开发与应用创刊20周年庆祝大会论文集[C];2005年
2 李浩田;牛少彰;;AHP层次化分析方法在网络应急预案中的应用[A];2009全国计算机网络与通信学术会议论文集[C];2009年
3 刘霄;邵健;庄越挺;;基于主题模型的网络突发热点事件检测[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【poster】[C];2011年
中国重要报纸全文数据库 前10条
1 本报记者 唐冬梅;“内容管理”:突发事件应急处理的保障[N];中国改革报;2003年
2 神州数码有限公司;从根本上解决问题[N];中国计算机报;2005年
3 朱杰;数字集群:没有障碍的天网[N];中国计算机报;2007年
4 北京大学计算机系 王文俊;应急联动系统建设面临的五大挑战[N];中国计算机报;2004年
5 本报记者 田径;“盗码器”考验智能卡“安全IQ”[N];通信产业报;2005年
6 电子科大科园公司 刘传君;从实际出发[N];计算机世界;2002年
7 钟明;宽带运营需要好“车库”[N];通信产业报;2003年
8 ;网络安全的指挥家[N];中国计算机报;2003年
9 游龙科技供稿;让服务器自己“管”自己[N];计算机世界;2002年
10 ;数据备份:防患于未然[N];中国计算机报;2002年
中国博士学位论文全文数据库 前1条
1 汤林勰;多媒体广告计算[D];中国科学技术大学;2011年
中国硕士学位论文全文数据库 前10条
1 罗永莲;突发事件语料噪声排除与网页去重方法研究[D];山西大学;2005年
2 文礼红;针对安全性突发事件中Windows系统证据调查的研究[D];南京航空航天大学;2005年
3 李卉;基于微博的网络突发事件分析研究[D];北京邮电大学;2013年
4 焦超;网络突发事件推手检测与热点预测研究[D];上海交通大学;2012年
5 宋晓龙;突发事件的互联网信息传播规律研究[D];哈尔滨工业大学;2011年
6 张锐;电子政务系统应急响应体系的研究与实践[D];重庆大学;2008年
7 刘澈;基于Pi演算的交通Web服务组装的描述和验证[D];大连理工大学;2009年
8 陈翰;突发事件网络舆情数据采集与抽取技术研究[D];解放军信息工程大学;2012年
9 王熙;基于用户关系分析和微博内容挖掘的信息推荐系统研究[D];北京邮电大学;2013年
10 冯静;微博用户排名机制的研究[D];燕山大学;2012年
,本文编号:533302
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/533302.html