支持语义推理的学科知识库设计与实现
发布时间:2022-10-19 14:10
2018年,据美国国家科学基金会(NSF)的统计数据显示,中国科学出版物的总量首次超过了美国,作为创新能力最有代表性的指标,其反应了一个国家经济发展和社会繁荣的主要驱动力。快速增长的数据,准确地识别出其对应的学科领域,无论是知识类别划分,还是高效率检索,都具有极大的战略意义。知识库系统不仅能够在效率上极大地节省检索到相关学科知识的时间,同时在未来也具有不可低估的商业潜力。本知识库提供论文的全文检索服务,并支持学科的自动分类,根据知识库构建流程可划分为六个核心模块,分别是数据支撑模块,学科分类模块,知识信息检索模块,统计分析模块,语义推理模块,日志监控模块。本人完成的工作如下所示:(1)数据采集,使用亿级数据集结合爬虫数据作为知识库数据基础,在此基础上进行有效的数据清洗,并入库搜索引擎,提供全文检索功能。(2)学科分类,使用词向量结合卷积神经网络进行模型的训练,并对比FastText,对数据文本进行学科分类。(3)知识信息检索,实现多种检索方式,包含简单检索,高级检索,领域检索等,提供不同排序方式排序检索结果,导出等多种功能。(4)统计分析,提供丰富的可视化显示,其中包括全局统计分析以及...
【文章页数】:80 页
【学位级别】:硕士
【文章目录】:
致谢
摘要
ABSTRACT
1 绪论
1.1 项目背景
1.2 国内外研究现状
1.2.1 国内研究现状
1.2.2 国外研究现状
1.3 研究内容
1.4 论文结构
2 相关理论及关键技术
2.1 Elasticsearch
2.2 现有学科分类体系
2.2.1 中华人民共和国学科分类与代码标准(GBT13745-2009)
2.2.2 CJCR(中国科技期刊引证报告)
2.2.3 中科院JCR分区
2.2.4 Microsoft Academic Graph(MAG)分类
2.3 Esrally
2.4 DevCloud
2.5 Selenium
2.6 Scrapy
2.7 本章小结
3 数据集
3.1 数据集
3.1.1 简介
3.1.2 数据描述
3.1.3 爬虫
3.2 Elasticsearch
3.2.1 索引设计
3.2.2 数据导入
3.2.3 数据清洗
3.2.4 参数调整
3.2.5 性能调优设计
3.3 异构系统的数据交换
3.4 本章小结
4 知识库系统需求分析
4.1 需求分析综述
4.2 知识库系统功能需求
4.2.1 数据支撑
4.2.2 学科分类功能
4.2.3 知识信息查询功能
4.2.4 统计分析功能
4.2.5 语义推理功能
4.2.6 日志监控功能
4.3 知识库系统非功能性需求
4.4 本章小结
5 知识库系统设计及实现
5.1 知识库系统概要设计
5.1.1 系统总体架构设计
5.1.2 系统功能架构设计
5.2 知识库系统详细设计和实现
5.2.1 学科分类模型的训练过程
5.2.2 知识信息查询模块
5.2.3 统计分析模块
5.2.4 语义推理模块
5.2.5 日志监控模块
5.3 本章小结
6 测试
6.1 环境与工具依赖
6.2 功能性测试
6.2.1 知识信息查询功能测试
6.2.2 统计分析功能测试
6.2.3 日志监控功能测试
6.3 非功能性测试
6.4 本章小结
7 总结与展望
7.1 总结
7.2 展望
参考文献
作者简历及攻读硕士/博士学位期间取得的研究成果
学位论文数据集
【参考文献】:
期刊论文
[1]知识图谱研究综述[J]. 李涓子,侯磊. 山西大学学报(自然科学版). 2017(03)
[2]知识图谱研究进展[J]. 漆桂林,高桓,吴天星. 情报工程. 2017(01)
[3]国内外知识库研究现状述评与比较[J]. 张斌,魏扣,郝琦. 图书情报知识. 2016(03)
[4]软件测试概论和方法[J]. 王佩多. 数字通信世界. 2015(08)
[5]Word2vec的工作原理及应用探究[J]. 周练. 科技情报开发与经济. 2015(02)
[6]基于知识库的动态蚁群算法[J]. 孙勇,李妮,龚光红,韩亮. 北京工业大学学报. 2012(03)
[7]基于本体的知识建模技术[J]. 张梅,郝佳,阎艳,李波. 北京理工大学学报. 2010(12)
[8]浅析黑盒测试与白盒测试[J]. 胡静. 衡水学院学报. 2008(01)
[9]技术整合中知识库的构建研究[J]. 张平 ,蓝海林 ,黄文彦. 科学学与科学技术管理. 2004(01)
[10]基于知识库的知识发现(KDK)的结构模型与挖掘算法研究[J]. 杨炳儒,申江涛,陈泓婕. 中国工程科学. 2003(06)
博士论文
[1]知识融合中若干关键技术研究[D]. 缑锦.浙江大学 2005
本文编号:3693509
【文章页数】:80 页
【学位级别】:硕士
【文章目录】:
致谢
摘要
ABSTRACT
1 绪论
1.1 项目背景
1.2 国内外研究现状
1.2.1 国内研究现状
1.2.2 国外研究现状
1.3 研究内容
1.4 论文结构
2 相关理论及关键技术
2.1 Elasticsearch
2.2 现有学科分类体系
2.2.1 中华人民共和国学科分类与代码标准(GBT13745-2009)
2.2.2 CJCR(中国科技期刊引证报告)
2.2.3 中科院JCR分区
2.2.4 Microsoft Academic Graph(MAG)分类
2.3 Esrally
2.4 DevCloud
2.5 Selenium
2.6 Scrapy
2.7 本章小结
3 数据集
3.1 数据集
3.1.1 简介
3.1.2 数据描述
3.1.3 爬虫
3.2 Elasticsearch
3.2.1 索引设计
3.2.2 数据导入
3.2.3 数据清洗
3.2.4 参数调整
3.2.5 性能调优设计
3.3 异构系统的数据交换
3.4 本章小结
4 知识库系统需求分析
4.1 需求分析综述
4.2 知识库系统功能需求
4.2.1 数据支撑
4.2.2 学科分类功能
4.2.3 知识信息查询功能
4.2.4 统计分析功能
4.2.5 语义推理功能
4.2.6 日志监控功能
4.3 知识库系统非功能性需求
4.4 本章小结
5 知识库系统设计及实现
5.1 知识库系统概要设计
5.1.1 系统总体架构设计
5.1.2 系统功能架构设计
5.2 知识库系统详细设计和实现
5.2.1 学科分类模型的训练过程
5.2.2 知识信息查询模块
5.2.3 统计分析模块
5.2.4 语义推理模块
5.2.5 日志监控模块
5.3 本章小结
6 测试
6.1 环境与工具依赖
6.2 功能性测试
6.2.1 知识信息查询功能测试
6.2.2 统计分析功能测试
6.2.3 日志监控功能测试
6.3 非功能性测试
6.4 本章小结
7 总结与展望
7.1 总结
7.2 展望
参考文献
作者简历及攻读硕士/博士学位期间取得的研究成果
学位论文数据集
【参考文献】:
期刊论文
[1]知识图谱研究综述[J]. 李涓子,侯磊. 山西大学学报(自然科学版). 2017(03)
[2]知识图谱研究进展[J]. 漆桂林,高桓,吴天星. 情报工程. 2017(01)
[3]国内外知识库研究现状述评与比较[J]. 张斌,魏扣,郝琦. 图书情报知识. 2016(03)
[4]软件测试概论和方法[J]. 王佩多. 数字通信世界. 2015(08)
[5]Word2vec的工作原理及应用探究[J]. 周练. 科技情报开发与经济. 2015(02)
[6]基于知识库的动态蚁群算法[J]. 孙勇,李妮,龚光红,韩亮. 北京工业大学学报. 2012(03)
[7]基于本体的知识建模技术[J]. 张梅,郝佳,阎艳,李波. 北京理工大学学报. 2010(12)
[8]浅析黑盒测试与白盒测试[J]. 胡静. 衡水学院学报. 2008(01)
[9]技术整合中知识库的构建研究[J]. 张平 ,蓝海林 ,黄文彦. 科学学与科学技术管理. 2004(01)
[10]基于知识库的知识发现(KDK)的结构模型与挖掘算法研究[J]. 杨炳儒,申江涛,陈泓婕. 中国工程科学. 2003(06)
博士论文
[1]知识融合中若干关键技术研究[D]. 缑锦.浙江大学 2005
本文编号:3693509
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3693509.html