面向大规模微博消息流的突发话题检测
发布时间:2017-11-10 19:14
本文关键词:面向大规模微博消息流的突发话题检测
更多相关文章: 突发话题检测 微博 联合聚类 影响力 大规模
【摘要】:突发事件在微博中迅速传播,产生巨大的影响力,因此,突发舆情受到政府、企业的广泛关注.现有的突发话题检测算法只考虑单一的特征实体,无法处理微博中新词、图片、链接等诱导的突发.面向大规模微博消息流,提出一种无需中文分词的实时突发话题检测框架模型.模型依据消息流动态调整窗口大小,并通过传播影响力度量实体的突发权值.采用高阶联合聚类算法同时对实体、消息、用户进行聚类分析,在检测突发话题的同时,得到话题的关联消息及参与用户.对比实验结果表明,算法的准确性高,能够更早地检测到突发话题.
【作者单位】: 哈尔滨工程大学信息安全研究中心;
【基金】:国家“八六三”高技术研究发展计划基金项目(2012AA012802) 国家自然科学基金项目(61170242)
【分类号】:TP393.092
【正文快照】: 随着微博的广泛使用,新浪、腾讯微博中每天涌现出大量的突发事件.面向微博消息流的实时突发话题检测成为舆情分析、数据挖掘等领域中的热点研究问题,并且在地震报告等方面得到了广泛的应用[1].微博是一种社会化媒体,其包含丰富的特征信息[2-3].微博消息流具有规模大、实时性强,
本文编号:1167979
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1167979.html