基于概念格的Web文本聚类过程模型研究
发布时间:2021-05-18 00:34
随着Internet时代的到来,Web信息呈现爆炸式增长,信息检索、文本挖掘这些情报学领域内的传统技术遇到了新的挑战,如何在海量级的Web文本中迅速找到符合自己需求的信息成为了一个新的课题。为解决这一问题,本文提出一种基于概念格的Web文本聚类过程模型,提供了一种全新的解决方法。本文以文本聚类现有的典型算法为切入点,深入分析了各个算法的优缺点,指出了现有文本聚类算法所存在的问题,接着引入了概念格这一新的数学工具,然后深入的了解了概念格的构造过程,并将这一构造过程引申到文本聚类过程中,使之成为了文本聚类的过程,从而在理论层面形成了一种全新的基于概念格的Web文本聚类过程模型。最后文本从应用角度验证了该模型,形成了2、3类文本聚类尤其是3类文本聚类结果与预想的结果相吻合,说明了该模型的可行性。本文的创新点在于给出了Web文本聚类的新方法,构造了一种基于概念格的Web文本聚类模型,在文本聚类方法上以及概念格应用上有所创新。文本的研究成果对情报学领域中的信息检索、文本挖掘提供了一种全新的解决思路,将数学领域内概念格方法进入了情报学领域进行研究,拓宽了研究思路,为情报学的相关研究起到了良好的促进...
【文章来源】:吉林大学吉林省 211工程院校 985工程院校 教育部直属院校
【文章页数】:62 页
【学位级别】:硕士
【文章目录】:
提要
第1章 绪论
1.1 研究背景及意义
1.2 相关研究综述
1.3 论文主要内容及创新点
1.3.1 论文的主要内容
1.3.2 论文的创新点
1.4 论文技术路线
第2章 相关理论基础
2.1 概念格理论基础
2.1.1 概念格相关概念
2.1.2 概念格的构造算法介绍
2.2 Web 文本聚类理论基础
2.2.1 Web 文本聚类相关概念
2.2.2 文本聚类方法
2.2.3 Web 文本聚类的一般处理过程
第3章 基于概念格的Web 文本聚类过程模型的构建
3.1 Web 文本预处理
3.2 文本特征的表示与提取
3.2.1 文本特征的表示
3.2.2 文本特征的提取
3.3 形式背景的构建
3.4 概念格的确定与表示
3.5 概念格Hasse 图的优化
3.6 聚类结果
3.7 基于概念格的Web 文本聚类过程模型
第4章 基于概念格的Web 文本聚类过程模型的应用
4.1 模型文本处理模块的应用
4.2 模型数据处理模块的应用
4.3 模型的优缺点分析
4.3.1 模型的优点
4.3.2 模型的缺点
第5章 结论与展望
5.1 结论
5.2 展望
参考文献
致谢
摘要
Abstract
本文编号:3192759
【文章来源】:吉林大学吉林省 211工程院校 985工程院校 教育部直属院校
【文章页数】:62 页
【学位级别】:硕士
【文章目录】:
提要
第1章 绪论
1.1 研究背景及意义
1.2 相关研究综述
1.3 论文主要内容及创新点
1.3.1 论文的主要内容
1.3.2 论文的创新点
1.4 论文技术路线
第2章 相关理论基础
2.1 概念格理论基础
2.1.1 概念格相关概念
2.1.2 概念格的构造算法介绍
2.2 Web 文本聚类理论基础
2.2.1 Web 文本聚类相关概念
2.2.2 文本聚类方法
2.2.3 Web 文本聚类的一般处理过程
第3章 基于概念格的Web 文本聚类过程模型的构建
3.1 Web 文本预处理
3.2 文本特征的表示与提取
3.2.1 文本特征的表示
3.2.2 文本特征的提取
3.3 形式背景的构建
3.4 概念格的确定与表示
3.5 概念格Hasse 图的优化
3.6 聚类结果
3.7 基于概念格的Web 文本聚类过程模型
第4章 基于概念格的Web 文本聚类过程模型的应用
4.1 模型文本处理模块的应用
4.2 模型数据处理模块的应用
4.3 模型的优缺点分析
4.3.1 模型的优点
4.3.2 模型的缺点
第5章 结论与展望
5.1 结论
5.2 展望
参考文献
致谢
摘要
Abstract
本文编号:3192759
本文链接:https://www.wllwen.com/tushudanganlunwen/3192759.html