基于情感时间序列的微博热点主题检测
发布时间:2017-12-16 08:14
本文关键词:基于情感时间序列的微博热点主题检测
更多相关文章: 情感分析 热点主题 情感时间序列 实时检测 微博
【摘要】:随着互联网的蓬勃发展,微博在信息传播过程中扮演着非常重要的角色,正逐渐演变成一种新型线上交流新闻源.人们已经习惯于通过微博平台来了解他们身边的朋友或家人在做什么,关心这个世界正在发生什么.然而,由于微博平台蕴含着海量信息,很难以人工的方式在微博上快速检测当前实时发生的重大新闻或突发事件.因此,面向微博的热点主题检测成为当下的一个研究热点.然而,现有研究主要侧重于主题识别而忽略了用户对于实时性的要求,少数针对实时热点主题发现的方法主要基于关键词的统计分析,实时性和准确率都有待提高.根据我们的观察发现,微博平台汇集了成千上万的观点与意见,包括对社会事件的讨论、对产品的评价等,这些观点使得微博成为一个非常有价值的观点意见数据源.通过分析观点与情感的实时变化,我们可以更好地了解相关主题的变化趋势,从而辅助用户判定其是否是流行的热点主题.本文结合微博的情感时序变化提出了一种实时的非参数化的热点主题检测方法.该方法通过对微博情感极性分析及其强度变化来计算情感时序分布,并利用上述特征构建一个复合模型以识别、检测微博热点主题.实验分别在Twitter和新浪微博等真实数据集上进行,结果表明我们提出的方法能够在保证检测准确率的前提下更快地识别热点话题.
【作者单位】: 国际关系学院信息科技学院;首都师范大学信息工程学院;香港中文大学系统工程与工程管理系;北京大学信息工程学院;
【基金】:国家自然科学基金(批准号:61502115,61370165,61572043) 中央高校基本科研项目(批准号:3262014T75,3262015T20)资助
【分类号】:TP393.092;TP391.1
【正文快照】: 1引言随着互联网的蓬勃发展,微博在信息传播中扮演着非常重要的角色,它可以让一条很小的信息在很短的时间内传播到世界的各个角落.可以说,微博已经逐渐演变成一种等同于新闻源的新型线上交流信息平台[1].微博的出现与流行给我们的日常生活带来了巨大影响,它像一面镜子真实的反,
本文编号:1295310
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1295310.html