当前位置:主页 > 管理论文 > 移动网络论文 >

LDA和KNN相结合的帖子热度预测算法

发布时间:2017-09-28 01:04

  本文关键词:LDA和KNN相结合的帖子热度预测算法


  更多相关文章: 网络舆情 潜在狄利克雷分配 K近邻 帖子热度预测 相似性


【摘要】:随着互联网的快速发展,网络舆情对社会的影响与日俱增.对互联网上网民产生的海量文本内容进行快速准确的分析,以及在此基础上捕捉网络舆情,并对其发展趋势进行预测,对社会经济发展无疑具有重要意义.为此,本文研究了论坛中帖子的热度预测问题,针对现有算法在度量帖子内容相似性时仅仅考虑字面上的相似性,未涉及语义层面,并且未考虑发帖人的特定喜好等不足,提出了LDA(潜在狄利克雷分配)与KNN(K近邻)相结合的热度预测算法,该算法利用LDA挖掘帖子表面文本隐藏的主题信息和用户感兴趣的主题信息,在概念层面上度量帖子之间的相似性,在此基础上基于KNN算法对帖子的热度进行预测.在两组数据集的实验结果表明,所提出的算法在预测准确率方面明显优于相关工作中的方法,平均准确率分别提高了4.34%和2.52%.
【作者单位】: 四川大学计算机学院;四川省军区军训办公室;华西第二医院信息管理部;
【关键词】网络舆情 潜在狄利克雷分配 K近邻 帖子热度预测 相似性
【基金】:浙江省自然科学基金(LY12F02010) 四川大学青年基金(2011SCU11017)
【分类号】:TP393.09;TP391.1
【正文快照】: 1引言随着互联网的普及,网络用户数量快速增长,越来越多的网民倾向于利用网络平台来发表自己的看法和意见.论坛作为重要的网络平台,拥有大量的用户,是人们获取信息,发表言论的重要场所.例如,天涯论坛目前有7000多万注册用户,数以万计的用户每天在上面发表或者回复自己感兴趣的

【参考文献】

中国期刊全文数据库 前8条

1 高辉;王沙沙;傅彦;;Web舆情的长期趋势预测方法[J];电子科技大学学报;2011年03期

2 卢s,

本文编号:932900


资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/932900.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ffd82***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com