创业领域文献知识图谱构建与应用研究
发布时间:2022-11-08 19:24
随着知识图谱的发展,目前已经出现很多优秀的学术知识图谱,比较知名的有Aminer平台、微软学术图谱等,旨在对不同的学术数据进行集成,为科研人员提供更多学术搜索上的帮助。但这些学术图谱建立的是面向通用领域的知识库,在对实体的抽取上只考虑了论文、期刊、学者等通用实体,大量的语义信息没有被挖掘出来,本质的科学问题缺少对于文献实体深度的定义和分析,本文通过定义文献中隐含的语义实体,使用Text CNN分类算法关联研究方法与论文实体,融合语义信息借助随机森林算法梳理其语义模式,构建多语义属性的实体模型,搭建基于语义信息的多维度知识图谱,为科研人员提供多维度的语义检索方式,帮助其快速理解文献深层内容。本文选取分析的文献领域为创业领域,该领域的研究从1980年左右兴起,并迅速进入研究高潮得到研究学者们的青睐,文献内容详实,领域特征明显且论文数量处于快速增长阶段,现有的通用实体类型已不能很好地满足对数据的多维度信息搜索。本文利用知识图谱技术,以创业领域中常见且重要的研究方法这一语义信息为例,构建概念实体,在实体识别的过程中,利用Text CNN实现对文本的分类和定位,并对这一实体在摘要中的语义模式进行...
【文章页数】:74 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第1章 绪论
1.1 研究背景和意义
1.2 研究现状
1.3 本文的主要工作
1.4 本文的组织结构
第2章 相关研究综述
2.1 学术知识图谱的概述
2.2 传统文本的分类方法概述
2.3 深度学习的文本分类方法概述
2.4 本章小结
第3章 基于TextCNN算法的语义实体抽取
3.1 学术知识图谱的构建流程
3.2 数据模式定义
3.3 基于TextCNN的算法设计
3.3.1 任务概述
3.3.2 算法的框架设计
3.4 实验结果与分析
3.4.1 数据准备
3.4.2 数据文本向量化
3.4.3与基线算法的分类对比实验
3.4.4 实验结果
3.5 本章小结
第4章 针对语义实体关系属性的语句抽取
4.1 任务概述
4.2 子分类特征词匹配实验
4.3 基于机器学习的抽取实验
4.4 实验结果及对比分析
4.4.1 基于逻辑回归的实验
4.4.2 基于决策树的实验
4.4.3 基于随机森林的实验
4.4.4 结果对比与分析
4.5 本章小结
第5章 面向创业领域学术论文的推荐系统
5.1 知识图谱的存储
5.2 系统的设计和实现
5.2.1 前端框架的搭建
5.2.2 后端功能的实现
5.3 系统展示
5.4 本章小结
第6章 总结与展望
6.1 研究总结
6.2 研究展望
参考文献
作者简介及在学期间所取得的科研成果
致谢
【参考文献】:
期刊论文
[1]大规模知识图谱及其应用研究[J]. 孙雨生,常凯月,朱礼军. 情报理论与实践. 2018(11)
[2]科技论文检索工作中SCI数据库的使用探究[J]. 夏冬,任波,谢黎. 图书情报导刊. 2016(12)
[3]基于Neo4j的领域本体存储方法研究[J]. 王红,张青青,蔡伟伟,姜洋. 计算机应用研究. 2017(08)
[4]知识图谱构建技术综述[J]. 刘峤,李杨,段宏,刘瑶,秦志光. 计算机研究与发展. 2016(03)
[5]为何非精英群体能在海外成功创业?——基于对佛罗伦萨温商的实证研究[J]. 周欢怀,朱沛. 管理世界. 2014(02)
[6]搜索引擎学术研究知识图谱[J]. 刘阳,宋余庆. 图书情报知识. 2010(06)
[7]科学知识图谱研究综述[J]. 梁秀娟. 图书馆杂志. 2009(06)
[8]基于本体的关系数据库语义检索[J]. 王珊,张俊,彭朝晖,战疆,杜小勇. 计算机科学与探索. 2007(01)
[9]本体论研究综述[J]. 李善平,尹奇韡,胡玉杰,郭鸣,付相君. 计算机研究与发展. 2004(07)
[10]元数据开发应用的标准化框架[J]. 张晓林. 现代图书情报技术. 2001(02)
本文编号:3704419
【文章页数】:74 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第1章 绪论
1.1 研究背景和意义
1.2 研究现状
1.3 本文的主要工作
1.4 本文的组织结构
第2章 相关研究综述
2.1 学术知识图谱的概述
2.2 传统文本的分类方法概述
2.3 深度学习的文本分类方法概述
2.4 本章小结
第3章 基于TextCNN算法的语义实体抽取
3.1 学术知识图谱的构建流程
3.2 数据模式定义
3.3 基于TextCNN的算法设计
3.3.1 任务概述
3.3.2 算法的框架设计
3.4 实验结果与分析
3.4.1 数据准备
3.4.2 数据文本向量化
3.4.3与基线算法的分类对比实验
3.4.4 实验结果
3.5 本章小结
第4章 针对语义实体关系属性的语句抽取
4.1 任务概述
4.2 子分类特征词匹配实验
4.3 基于机器学习的抽取实验
4.4 实验结果及对比分析
4.4.1 基于逻辑回归的实验
4.4.2 基于决策树的实验
4.4.3 基于随机森林的实验
4.4.4 结果对比与分析
4.5 本章小结
第5章 面向创业领域学术论文的推荐系统
5.1 知识图谱的存储
5.2 系统的设计和实现
5.2.1 前端框架的搭建
5.2.2 后端功能的实现
5.3 系统展示
5.4 本章小结
第6章 总结与展望
6.1 研究总结
6.2 研究展望
参考文献
作者简介及在学期间所取得的科研成果
致谢
【参考文献】:
期刊论文
[1]大规模知识图谱及其应用研究[J]. 孙雨生,常凯月,朱礼军. 情报理论与实践. 2018(11)
[2]科技论文检索工作中SCI数据库的使用探究[J]. 夏冬,任波,谢黎. 图书情报导刊. 2016(12)
[3]基于Neo4j的领域本体存储方法研究[J]. 王红,张青青,蔡伟伟,姜洋. 计算机应用研究. 2017(08)
[4]知识图谱构建技术综述[J]. 刘峤,李杨,段宏,刘瑶,秦志光. 计算机研究与发展. 2016(03)
[5]为何非精英群体能在海外成功创业?——基于对佛罗伦萨温商的实证研究[J]. 周欢怀,朱沛. 管理世界. 2014(02)
[6]搜索引擎学术研究知识图谱[J]. 刘阳,宋余庆. 图书情报知识. 2010(06)
[7]科学知识图谱研究综述[J]. 梁秀娟. 图书馆杂志. 2009(06)
[8]基于本体的关系数据库语义检索[J]. 王珊,张俊,彭朝晖,战疆,杜小勇. 计算机科学与探索. 2007(01)
[9]本体论研究综述[J]. 李善平,尹奇韡,胡玉杰,郭鸣,付相君. 计算机研究与发展. 2004(07)
[10]元数据开发应用的标准化框架[J]. 张晓林. 现代图书情报技术. 2001(02)
本文编号:3704419
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3704419.html
最近更新
教材专著