基于Q-LDA主题模型的网络健康社区主题挖掘研究
发布时间:2024-02-03 16:45
【目的】信息质量是主题发现的重要影响因素,通过构建Q-LDA模型进行网络健康社区主题挖掘,弥补LDA主题模型在网络信息质量方面的不足,并增强模型的主题表示能力。【方法】研究网络健康信息质量评价体系,并对网络健康信息进行质量加权,在LDA主题模型的基础上建立Q-LDA主题挖掘模型,利用实际数据对模型进行验证。【结果】Q-LDA模型的结果可解释性和主题表达能力优于传统的LDA主题模型,其主题挖掘效率提高16%,能够更有效地挖掘网络健康社区信息所隐藏的主题。【局限】只选取网络健康社区内某一种疾病版块的文本数据,其代表性可能存在不足。【结论】在考虑网络健康信息质量的情况下进行主题挖掘,其结果能更好地满足网络健康社区用户的需求。
【文章页数】:8 页
【部分图文】:
本文编号:3894425
【文章页数】:8 页
【部分图文】:
图1基于Q-LDA主题模型的知识发现模型
如何挖掘数据背后隐藏的信息以满足社区用户的健康信息需求是网络健康数据研究的重点[29]。为充分满足具有不同认知能力的社区用户的健康知识需求,利用主题挖掘模型可以直观表达网络健康社区内用户关注的热点主题,有利于用户快速找到自己需要的健康信息。本文设计的主题挖掘模型如图1所示。整个主....
图2Q-LDA模型中随主题数量变化的困惑度分布
由于主题表示结果的优劣受到主题数量影响,为确定最优主题数量,本文引入困惑度指标。困惑度是衡量主题建模结果的常用指标,能够判断出主题模型对于不确定数据的预测能力,其数值越小,表示主题的预测能力越好,模型在不同主题数进行实验的困惑度值如图2所示。随着主题数的不断增加,困惑度的数值会随....
本文编号:3894425
本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/3894425.html