基于CFDP-LDA模型的主题聚合度研究

发布时间:2022-05-06 21:14
  互联网技术的快速发展有利于信息存储、提取和传播,使得大量的信息得以转换为电子文档的形式,从而可以有效的以半结构或者非结构化的数据类型保存,很大程度上缓解了大数据储存和展现的困难。现如今如何对海量的文档信息进行筛选和管理信息成为用户的主要需求,文本挖掘正是基于以上需求发展起来的,成为当前的研究热点。文本挖掘主要应用于主题挖掘、文本分类、文本聚类、情感分析、舆情分析等,针对不同的需求在各个领域发挥作用,其中主题挖掘是文本挖掘技术中不可或缺的重要部分。面对大量的无法直接进行分析的半结构化和非结构化数据,想要对其进行信息检索、信息过滤、情感分析等研究的基础是进行主题挖掘。随着数学、计算机语言、统计学等学科的交叉运用和发展,主题挖掘技术得到了很好的发展和完善。目前,主题模型因其完备的三层贝叶斯生成模型而具有优良的统计特性,在主题挖掘研究中受到广泛关注和推广。主题模型的出现大大提高了文本主题挖掘的准确率,但是主题模型也存在一些难题,(1)主题个数问题,传统的主题模型中主题个数是人为主观设定,该方法不具备客观性,主题个数设置的不同会导致主题挖掘结果发生很大变化;(2)主题聚合度问题,在传统的主题模型... 

【文章页数】:63 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第1章 引言
    1.1 研究背景与研究意义
        1.1.1 研究背景
        1.1.2 研究意义
    1.2 主要贡献与内容安排
        1.2.1 主要贡献
        1.2.2 内容安排
第2章 文献综述
    2.1 主题模型的发展
        2.1.1 LSI模型
        2.1.2 pLSA模型
        2.1.3 LDA模型的拓展
    2.2 文本主题聚合度研究综述
第3章 相关基础理论及模型构建
    3.1 相关基础理论
    3.2 CFDP-LDA模型构建的总体方案
    3.3 目标一致性证明
        3.3.1 LDA模型的优化目标
        3.3.2 CFDP-LDA模型的一致性证明
    3.4 CFDP-LDA模型的实现流程
第4章 基于CFDP-LDA模型的实证分析
    4.1 实验环境
    4.2 数据预处理
    4.3 CFDP-LDA模型的技术实现
    4.4 实证分析
        4.4.1 算法流程
        4.4.2 实证结果可视化
        4.4.3 比较分析
    4.5 模型评价
第5章 总结与展望
    5.1 本文总结
    5.2 研究展望
参考文献
致谢
个人简历、在学期间发表的学术论文及研究成果


【参考文献】:
期刊论文
[1]基于文档主题结构和词图迭代的关键词抽取方法研究[J]. 孙明珠,马静,钱玲飞.  数据分析与知识发现. 2019(08)
[2]基于频繁词网络的LDA最优主题个数选取方法[J]. 李菲菲,王移芝.  计算机技术与发展. 2018(08)
[3]LDA模型的优化及其主题数量选择研究——以科技文献为例[J]. 王婷婷,韩满,王宇.  数据分析与知识发现. 2018(01)
[4]基于LDA模型和多层聚类的微博话题检测[J]. 刘红兵,李文坤,张仰森.  计算机技术与发展. 2016(06)
[5]基于改进的LDA主题模型的微博用户聚类研究[J]. 裴超,肖诗斌,江敏.  情报理论与实践. 2016(03)
[6]一种结合有监督学习的动态主题模型[J]. 蒋卓人,陈燕,高良才,汤帜,刘晓钟.  北京大学学报(自然科学版). 2015(02)
[7]基于LDA-wSVM模型的文本分类研究[J]. 李锋刚,梁钰,GAO Xiao-zhi,ZENGER Kai.  计算机应用研究. 2015(01)
[8]基于LDA模型的科技期刊主题演化研究[J]. 李湘东,张娇,袁满.  情报杂志. 2014(07)
[9]最大距离法选取初始簇中心的K-means文本聚类算法的研究[J]. 翟东海,鱼江,高飞,于磊,丁锋.  计算机应用研究. 2014(03)
[10]基于混合模型的文本主题-情感分析方法[J]. 樊娜,蔡皖东,赵煜.  华中科技大学学报(自然科学版). 2010(01)

硕士论文
[1]基于统计学习方法的高斯LDA模型的文本聚类研究[D]. 王宇.华侨大学 2017
[2]基于SOM的文本聚类模型研究[D]. 黎猛.华中科技大学 2011



本文编号:3651228

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3651228.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户45ddd***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com