面向科研人员兴趣画像的多语作者主题模型研究
发布时间:2021-06-03 19:40
全球化背景下,从不同语种的海量科研文献数据集中自动挖掘隐含主题,精准刻画科研人员研究兴趣是信息服务迈向知识服务的关键问题,也是跨语言信息检索的关键技术之一。目前刻画科研人员兴趣的方法多基于其某一语种的文献,不适用于多语言数据集。本文在作者主题模型和多语言主题模型的基础上提出了多语作者主题(JointAT)模型,可从多语言数据集刻画作者兴趣,并给出了一种估计JointAT模型参数的吉布斯采样方法。实验结果表明,JointAT模型与作者主题(AT)模型相比具有更好的泛化能力。
【文章来源】:情报学报. 2020,39(06)北大核心CSSCICSCD
【文章页数】:8 页
【部分图文】:
LDA模型的概率图模型
综上,AT模型可以在单语言语料集中挖掘作者兴趣,JointLDA则适用于在多语言文本下挖掘文档主题。本文的目标就是构建融合这两种模型特征的新模型,实现在多语言语料中挖掘作者兴趣的目标。图3 JointLDA模型的概率图模型
JointLDA模型的概率图模型
【参考文献】:
期刊论文
[1]作者主题演化模型及其在研究兴趣演化分析中的应用[J]. 史庆伟,乔晓东,徐硕,农国武. 情报学报. 2013 (09)
本文编号:3211129
【文章来源】:情报学报. 2020,39(06)北大核心CSSCICSCD
【文章页数】:8 页
【部分图文】:
LDA模型的概率图模型
综上,AT模型可以在单语言语料集中挖掘作者兴趣,JointLDA则适用于在多语言文本下挖掘文档主题。本文的目标就是构建融合这两种模型特征的新模型,实现在多语言语料中挖掘作者兴趣的目标。图3 JointLDA模型的概率图模型
JointLDA模型的概率图模型
【参考文献】:
期刊论文
[1]作者主题演化模型及其在研究兴趣演化分析中的应用[J]. 史庆伟,乔晓东,徐硕,农国武. 情报学报. 2013 (09)
本文编号:3211129
本文链接:https://www.wllwen.com/tushudanganlunwen/3211129.html