当前位置:主页 > 科技论文 > 软件论文 >

一种面向词汇突发的连续时间主题模型

发布时间:2017-12-14 20:31

  本文关键词:一种面向词汇突发的连续时间主题模型


  更多相关文章: 主题模型 潜在Dirichlet分配 词汇突发 Dirichlet组合多项式 Gibbs采样 不动点迭代法


【摘要】:针对传统基于多项式分布的主题模型不能较好地刻画文档中词汇突发的现象,综合考虑文本集固有的时间信息,提出一种面向词汇突发的Dirichlet组合多项式(DCM)连续时间主题模型。采用DCM分布对文本集中的词汇突发现象进行建模,利用Beta分布刻画文本集中的时间特征,通过Gibbs采样和不动点迭代法实现模型参数的估计。实验结果表明,在预设主题数目较少的情况下,与To T和DCMLDA模型相比,该模型具有明显的泛化性能优势,并且可以有效揭示出文本集中潜在的主题演化趋势。
【作者单位】: 海南大学信息科学技术学院;
【基金】:国家自然科学基金(61462022)
【分类号】:TP391.1
【正文快照】: 中文引用格式:刘良选,黄梦醒.一种面向词汇突发的连续时间主题模型[J].计算机工程,2016,42(11):195-201.英文引用格式:Liu Liangxuan,Huang Mengxing.A Continuous-time Topic Model for Word Burstiness[J].ComputerEngineering,2016,42(11):195-201.0概述随着信息技术的快速

本文编号:1289303

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1289303.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c1350***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com