LDA和KNN相结合的帖子热度预测算法
发布时间:2017-09-28 01:04
本文关键词:LDA和KNN相结合的帖子热度预测算法
更多相关文章: 网络舆情 潜在狄利克雷分配 K近邻 帖子热度预测 相似性
【摘要】:随着互联网的快速发展,网络舆情对社会的影响与日俱增.对互联网上网民产生的海量文本内容进行快速准确的分析,以及在此基础上捕捉网络舆情,并对其发展趋势进行预测,对社会经济发展无疑具有重要意义.为此,本文研究了论坛中帖子的热度预测问题,针对现有算法在度量帖子内容相似性时仅仅考虑字面上的相似性,未涉及语义层面,并且未考虑发帖人的特定喜好等不足,提出了LDA(潜在狄利克雷分配)与KNN(K近邻)相结合的热度预测算法,该算法利用LDA挖掘帖子表面文本隐藏的主题信息和用户感兴趣的主题信息,在概念层面上度量帖子之间的相似性,在此基础上基于KNN算法对帖子的热度进行预测.在两组数据集的实验结果表明,所提出的算法在预测准确率方面明显优于相关工作中的方法,平均准确率分别提高了4.34%和2.52%.
【作者单位】: 四川大学计算机学院;四川省军区军训办公室;华西第二医院信息管理部;
【关键词】: 网络舆情 潜在狄利克雷分配 K近邻 帖子热度预测 相似性
【基金】:浙江省自然科学基金(LY12F02010) 四川大学青年基金(2011SCU11017)
【分类号】:TP393.09;TP391.1
【正文快照】: 1引言随着互联网的普及,网络用户数量快速增长,越来越多的网民倾向于利用网络平台来发表自己的看法和意见.论坛作为重要的网络平台,拥有大量的用户,是人们获取信息,发表言论的重要场所.例如,天涯论坛目前有7000多万注册用户,数以万计的用户每天在上面发表或者回复自己感兴趣的
【参考文献】
中国期刊全文数据库 前8条
1 高辉;王沙沙;傅彦;;Web舆情的长期趋势预测方法[J];电子科技大学学报;2011年03期
2 卢s,
本文编号:932900
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/932900.html