当前位置:主页 > 科技论文 > 软件论文 >

融合主题与语言模型的蒙古文信息检索方法研究

发布时间:2017-10-03 07:02

  本文关键词:融合主题与语言模型的蒙古文信息检索方法研究


  更多相关文章: 蒙古文 语言模型 主题模型 Gibbs采样 信息检索


【摘要】:为了从日益丰富的蒙古文信息中快速准确地检索用户需求的主题信息,提出了一种融合主题模型LDA与语言模型的方法。该方法用语言模型与LDA模型对蒙古文文档进行建模,利用吉普斯抽样方法进行推理间接计算模型的参数,挖掘隐藏在文档内不同主题与词之间的关系,得到文档的主题分布,并以此分布来计算与检索关键词主题之间的相似度,最后返回与该主题最相关的文档。语言模型充分利用蒙古文语法特征以及统计信息,而主题模型LDA又具有良好的潜在语义挖掘及主题发现的泛化学习能力,从而结合两种方法更好地实现蒙古文文档的主题语义检索,提高检索准确性。实验结果表明,融合LDA与语言模型的方法相比单一模型体现主题语义方面取得了较好的效果。
【作者单位】: 内蒙古师范大学计算机与信息工程学院;
【关键词】蒙古文 语言模型 主题模型 Gibbs采样 信息检索
【基金】:国家自然科学基金资助项目(61562068) 内蒙古自然科学基金资助项目(2013MS0912) 内蒙古自治区教育部人文社会科学研究项目(13YJAZH080)
【分类号】:TP391.3
【正文快照】: 关键词:蒙古文;语言模型;主题模型;Gibbs采样;信息检索0引言近年来随着蒙古文信息的日益丰富,研究从大量的信息资源中找出满足用户需求的信息已受到越来越多的关注。但是由于蒙古文语言表达形式的多样性,存在大量的同义词、语意特征和丰富的句法特征,比如“”和“”都是关于寻

本文编号:963782

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/963782.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户277c8***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com