基于速度增长的微博热点话题发现
发布时间:2021-06-15 01:10
在微博热点话题发现中,由于微博文本短、词量少、用词不规范等特征,使得传统的热点话题检测方法力不从心。针对这一问题,提出了基于速度增长的微博热点话题发现方法。首先把经过预处理的微博按等数量窗口划分,统计每个窗口内各词语的词频,并表示成时间二元组序列;然后通过计算每相邻两个窗口的个词语的增长斜率来发现增长速度快的词语;再通过计算与该词语有关的用户的增长速度和微博条数的增长速度来确定该词语是否是热点主题词;最后通过热点主题词聚类产生热点话题。通过实验验证了该方法的可行性。实验结果表明,该方法在一定程度上提高了检测效率,降低了漏检率和误检率,可以有效地及时发现微博热点话题。
【文章来源】:计算机应用研究. 2013,30(09)北大核心CSCD
【文章页数】:4 页
【参考文献】:
期刊论文
[1]一种中文微博新闻话题检测的方法[J]. 郑斐然,苗夺谦,张志飞,高灿. 计算机科学. 2012(01)
[2]引入活跃指数的微博用户排名机制[J]. 石磊,张聪,卫琳. 小型微型计算机系统. 2012(01)
硕士论文
[1]中文微博客热点话题检测与跟踪技术研究[D]. 孙胜平.北京交通大学 2011
[2]微博客热点话题发现策略研究[D]. 杨冠超.浙江大学 2011
本文编号:3230600
【文章来源】:计算机应用研究. 2013,30(09)北大核心CSCD
【文章页数】:4 页
【参考文献】:
期刊论文
[1]一种中文微博新闻话题检测的方法[J]. 郑斐然,苗夺谦,张志飞,高灿. 计算机科学. 2012(01)
[2]引入活跃指数的微博用户排名机制[J]. 石磊,张聪,卫琳. 小型微型计算机系统. 2012(01)
硕士论文
[1]中文微博客热点话题检测与跟踪技术研究[D]. 孙胜平.北京交通大学 2011
[2]微博客热点话题发现策略研究[D]. 杨冠超.浙江大学 2011
本文编号:3230600
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3230600.html