知识管理系统中的知识树的自动构建技术研究
发布时间:2023-04-01 04:00
我们正处于一个知识经济的时代,知识正取代传统的土地、自然资源、资本和劳动力成为推动社会进步与发展的主要力量。知识经济在客观上要求有与之相适应的管理模式和理论,以及有效的技术手段。基于这个背景,本文着重研究和探讨了文本知识管理中知识树的自动构建,文本特征选择方法,并设计和实现了一个知识管理原型系统。具体来说有以下几个方面: (1)基于文本聚类方法设计了一种新的知识树构建方法。针对当前知识管理系统中知识树的创建和维护问题,设计了一种新的基于文本聚类的知识树构建方法。由于从传统的K-means和SOM等文本聚类的结果中难以提取知识树中节点对应的概念和词汇列表,本文选取概率潜在语义分析(Probabilistic Latent Semantic Analysis,简称PLSA)方法进行聚类和知识层次树构建。实验表明,新方法除了在聚类精确度上优于传统方法,聚类结果还包含文档的主题与词汇之间的概率关系,因此新方法在聚类的同时,可以方便的提取知识树上每个节点对应的概念或概念集合。 (2)基于潜在语义信息提出了一种新的特征词选取方法。特征选择在文本分类中起着重要的作用。文档频率(document fr...
【文章页数】:60 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
1 绪论
1.1 选题的背景
1.2 国内外的研究现状
1.2.1 国内研究现状
1.2.2 国外研究现状
1.3 本文的研究目的和意义
1.4 本文研究内容,方法与文章结构
1.4.1 研究内容与方法
1.4.2 文章结构
2 知识管理和知识管理系统
2.1 知识与知识管理
2.1.1 知识的概念
2.1.2 知识的分类和特点
2.1.3 知识管理的概念
2.1.4 知识管理的目标和原则
2.2 知识树概论
2.2.1 知识树的概念
2.2.3 知识树构建存在的问题
3 概率潜在语义分析
3.1 文本聚类的简介
3.1.1 什么是文本聚类
3.1.2 常用的文本聚类及介绍
3.1.3 现有方法中存在的问题
3.2 PLSA 方法简介
3.3 PLSA 算法
4 基于文本聚类的知识树自动构建方法
4.1 知识层次树自动构建方法
4.2 算法比较和分析
4.2.1 实验数据集
4.2.2 评价标准
4.2.3 结果及分析
5 基于潜在语义信息的特征词选择方法
5.1 特征词选择方法概论
5.1.1 什么是特征词选择
5.1.2 现有特征词选择方法及简介
5.1.3 现有方法的优缺点
5.2 基于潜在语义信息的特征词选择方法
5.2.1 方法简介
5.2.2 方法详述
5.3 常用的文本分类的模型及算法简介
5.3.1 朴素贝叶斯方法
5.3.2 k-NN 方法
5.3.3 支持向量机方法
5.3.4 决策树方法
5.3.5 神经网络方法
5.4 算法比较和分析
5.4.1 测试环境介绍
5.4.2 实验数据集
5.4.3 评价标准
5.4.4 结果及分析
6 知识管理原型系统的设计和实现
6.1 系统总体分析和设计
6.1.1 系统框架
6.1.2 技术路线
6.2 系统模块实现
6.2.1 知识获取接口
6.2.2 文本预处理模块
6.2.3 知识树构建模块
6.2.4 新增文档处理模块
6.2.5 用户接口
6.3 系统运行效果图
7 总结和展望
7.1 本文主要贡献和创新
7.2 下一步研究工作
致谢
参考文献
附录
本文编号:3776420
【文章页数】:60 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
1 绪论
1.1 选题的背景
1.2 国内外的研究现状
1.2.1 国内研究现状
1.2.2 国外研究现状
1.3 本文的研究目的和意义
1.4 本文研究内容,方法与文章结构
1.4.1 研究内容与方法
1.4.2 文章结构
2 知识管理和知识管理系统
2.1 知识与知识管理
2.1.1 知识的概念
2.1.2 知识的分类和特点
2.1.3 知识管理的概念
2.1.4 知识管理的目标和原则
2.2 知识树概论
2.2.1 知识树的概念
2.2.3 知识树构建存在的问题
3 概率潜在语义分析
3.1 文本聚类的简介
3.1.1 什么是文本聚类
3.1.2 常用的文本聚类及介绍
3.1.3 现有方法中存在的问题
3.2 PLSA 方法简介
3.3 PLSA 算法
4 基于文本聚类的知识树自动构建方法
4.1 知识层次树自动构建方法
4.2 算法比较和分析
4.2.1 实验数据集
4.2.2 评价标准
4.2.3 结果及分析
5 基于潜在语义信息的特征词选择方法
5.1 特征词选择方法概论
5.1.1 什么是特征词选择
5.1.2 现有特征词选择方法及简介
5.1.3 现有方法的优缺点
5.2 基于潜在语义信息的特征词选择方法
5.2.1 方法简介
5.2.2 方法详述
5.3 常用的文本分类的模型及算法简介
5.3.1 朴素贝叶斯方法
5.3.2 k-NN 方法
5.3.3 支持向量机方法
5.3.4 决策树方法
5.3.5 神经网络方法
5.4 算法比较和分析
5.4.1 测试环境介绍
5.4.2 实验数据集
5.4.3 评价标准
5.4.4 结果及分析
6 知识管理原型系统的设计和实现
6.1 系统总体分析和设计
6.1.1 系统框架
6.1.2 技术路线
6.2 系统模块实现
6.2.1 知识获取接口
6.2.2 文本预处理模块
6.2.3 知识树构建模块
6.2.4 新增文档处理模块
6.2.5 用户接口
6.3 系统运行效果图
7 总结和展望
7.1 本文主要贡献和创新
7.2 下一步研究工作
致谢
参考文献
附录
本文编号:3776420
本文链接:https://www.wllwen.com/guanlilunwen/keyanlw/3776420.html