基于LDA模型和AP聚类的主题演化分析
本文关键词:基于LDA模型和AP聚类的主题演化分析
更多相关文章: 多主题演化 时间窗口 LDA模型 AP聚类算法 JS散度
【摘要】:随着互联网的高速发展,网络信息呈现爆炸性增长态势,主题演化分析能够帮助人们从海量的互联网数据中获取更有价值的信息。分析主题的演化发展轨迹有利于人们了解主题事件发生的前因后果,并对主题事件发展趋势进行更好地预测,进而辅助管控。针对单个主题演化分析方法中阈值设定和主题漂移的问题,提出一种LDA-AP主题演化模型。该方法利用LDA模型对不同时间窗口内的新闻文本分别进行建模,得到相应的主题。利用AP聚类算法对不同时间窗口内的多个主题进行聚类,其中计算主题相似度采用加入时间衰减因子的JS散度来度量。最后对多个主题内容进行演化分析。通过相关的实验分析和对比,结果表明该方法可以改善主题演化的性能,并能较好地分析多个新闻主题事件随时间的演化趋势。
【作者单位】: 合肥工业大学管理学院;教育部过程优化与智能决策重点实验室;
【关键词】: 多主题演化 时间窗口 LDA模型 AP聚类算法 JS散度
【基金】:国家自然科学青年基金(71301041,71271071)
【分类号】:TP391.1
【正文快照】: 0引言随着互联网的发展,社会化媒体如网络新闻、微博等已成为发布事件的主要载体,有效挖掘和分析其中的事件信息有利于帮助用户及时掌握事件动态,了解事件趋势。因此,从社会事件发生和传播中有效地挖掘和分析网络中的事件信息,具有重大的理论意义和实际价值。美国国防高级计划
【相似文献】
中国期刊全文数据库 前10条
1 袁伯秋;周一民;李林;;LDA模型参数有偏估计方法[J];小型微型计算机系统;2010年04期
2 唐晓波;向坤;;基于LDA模型和微博热度的热点挖掘[J];图书情报工作;2014年05期
3 王嘉琦;徐朝军;李艺;;基于LDA模型的社交网站自动量化评价研究[J];现代图书情报技术;2013年03期
4 曹娟;张勇东;李锦涛;唐胜;;一种基于密度的自适应最优LDA模型选择方法[J];计算机学报;2008年10期
5 楚克明;李芳;;基于LDA模型的新闻话题的演化[J];计算机应用与软件;2011年04期
6 石大文;张晖;;基于LDA模型的BBS话题演化[J];工业控制计算机;2012年05期
7 孙世杰;濮建忠;;基于LDA模型的Twitter中文微博热点主题词组发现[J];洛阳师范学院学报;2012年11期
8 石晶;胡明;石鑫;戴国忠;;基于LDA模型的文本分割[J];计算机学报;2008年10期
9 李保利;杨星;;基于LDA模型和话题过滤的研究主题演化分析[J];小型微型计算机系统;2012年12期
10 ;[J];;年期
中国重要会议论文全文数据库 前1条
1 丁兆云;王晖;;一种词位置相关的LDA模型[A];2013第一届中国指挥控制大会论文集[C];2013年
中国硕士学位论文全文数据库 前5条
1 张超;一种词性标注LDA模型的文本分类方法研究[D];华中师范大学;2015年
2 毛龙龙;基于LDA模型的微博情感分析技术研究[D];西北师范大学;2015年
3 张田田;基于LDA模型的实体解析技术的研究与实现[D];北京邮电大学;2013年
4 彭利斌;微博热点话题发现与话题演化的研究[D];桂林电子科技大学;2014年
5 荀静;基于LDA模型的文档情感摘要研究[D];山东师范大学;2015年
,本文编号:610886
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/610886.html