基于改进的OLDA模型话题检测及演化分析
发布时间:2018-02-22 17:38
本文关键词: 网络舆情 OLDA模型 话题演化 话题检测 Gibbs采样 特征字 出处:《情报杂志》2017年02期 论文类型:期刊论文
【摘要】:[目的/意义]话题检测和演化分析是网络舆情监控中的热点问题,对热点话题的检测和演化分析有助于挖掘热点话题和深入理解话题的演化趋势,并给以舆情监控者提供完整的话题演化路径和更为合理的决策意见。[方法/过程]OLDA(Online Latent Dirichlet Allocation)模型是用于挖掘热点话题和分析话题演化的工具,由于其存在新旧主题混合、冗余词较多的缺点,采用双通道模式对主题、词分布的遗传度进行改进,并给出了新的词分布计算方法。[结果/结论]提出的改进OLDA模型解决了新旧主题混合问题,降低冗余词的概率,更为明确地解释话题的含义。实验表明,改进的OLDA模型更为有效地对话题进行检测及演化分析。
[Abstract]:[objective / significance] topic detection and evolution analysis are hot issues in the monitoring of network public opinion. The detection and evolution analysis of hot topics is helpful to excavate hot topics and understand the evolution trend of topics deeply. The [method / process] OLDA(Online Latent Dirichlet allocation model is a tool for mining hot topics and analyzing topic evolution. Because of the disadvantages of redundant words, we improve the heritability of topic and word distribution by using two-channel model, and give a new method to calculate word distribution. [results / conclusion] the improved OLDA model solves the problem of mixing new and old topics. The experimental results show that the improved OLDA model is more effective in detecting and analyzing the topic evolution.
【作者单位】: 合肥工业大学管理学院;过程优化与智能决策教育部重点实验室;
【基金】:教育部人文社会科学研究项目“云计算环境下企业知识组织与知识门户系统研究”(编号:2012JYRW0710) 国家自然科学基金项目“基于制造大数据的产品研发知识集成与服务机制研究”(编号:71671057)
【分类号】:TP391.1;C912.63
,
本文编号:1524923
本文链接:https://www.wllwen.com/shekelunwen/shgj/1524923.html