基于时间序列分析的微博突发话题检测方法
发布时间:2017-10-03 19:47
本文关键词:基于时间序列分析的微博突发话题检测方法
【摘要】:针对微博信息噪音大、新颖度难以判断的问题,在动量模型的基础上进行优化,提出了基于时序分析的微博突发话题检测方法。通过动量模型提取候选突发特征后,对特征的动量时间序列分别借鉴信号频域分析理论和股票趋势分析理论进行建模,分析特征的频域特性来识别频繁伪突发特征,分析特征的新颖程度来识别间歇性伪突发特征,合并过滤后的有效突发特征形成突发话题。微博数据实验表明,该方法有效提高了突发话题检测的准确率和F值。
【作者单位】: 中国科学院计算技术研究所;国家计算机网络应急技术处理协调中心;
【关键词】: 突发话题 微博 突发特征 时序分析
【基金】:国家高技术研究发展计划(“863”计划)基金资助项目(No.2014AA015203) 国家科技支撑计划基金资助项目(No.2012BAH46B01)~~
【分类号】:TP393.092;TP391.1
【正文快照】: 1引言近年来,随着Web 2.0社交网络的兴起,微博以其方便快捷的优点迅速流行起来,现在已经发展成为网络信息传播的主要途径。微博用户数量众多,每天产生的信息量非常庞大。在微博中,人人都是信息的生产者和传播者,信息发布、转发非常便捷,这使微博成为信息传播速度最快的网络媒,
本文编号:966395
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/966395.html