非相关文献知识发现系统研究与实现
发布时间:2021-01-13 22:33
科技的发展和通讯技术的应用使得信息呈指数增长,信息激增和知识分裂使得人们获取知识变得困难,而获取隐藏于文献中的表面上没有关联的知识则更加困难。至上世纪中叶,情报工作者已经开始对知识分裂进行研究,直到1986年美国芝加哥大学的Don R.Swanson教授经过一系列研究提出了基于非相关文献的知识发现研究方法,为挖这种掘隐藏于文献中的知识提供了一盏明灯。非相关文献知识发现系统的开发,人们将繁琐冗杂的文献处理交给计算机,计算机将处理结果返回,提供最有可能的提示,节省了人们大量的时间和精力,推动了非相关文献知识研究方法的应用。首先,本文系统的归纳了现有的中英文非相关文献知识发现软件,通过对比分析,总结其中的有待改进之处。然后,本文以一套全新的思路为指导,对非相关文献知识发现继续研究。针对现有的非相关文献知识发现系统多以单种语言、医学文献为数据集,缺乏成熟的公开使用的系统,本文提出研究并设计一套适用于中英文文献、无学科限制、普遍适用的非相关文献知识发现系统。中文分词问题是中文信息处理的一个热点;文献中存在大量的无实际意义或与研究无关的词;自然语言广泛应用,使用自由、灵活给信息处理带来了困难,存在...
【文章来源】:南京农业大学江苏省 211工程院校 教育部直属院校
【文章页数】:85 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景
1.2 非相关文献知识发现系统现状
1.3 非相关文献知识发现研究目的和意义
1.4 本文主要研究内容
第二章 非相关文献知识发现系统介绍
2.1 非相关文献知识发现系统概述
2.2 SWANSON和ARROWSMITH
2.2.1 Swanson非相关文献知识发现算法原理
2.2.2 网络版的Arrowsmith使用
2.2.3 Arrowsmith数据处理方式
2.2.4 Arrowsmith系统评价
2.3 其他国外非相关文献知识发现系统
2.3.1 Gordon,Lindsay非相关文献知识发现系统
2.3.2 DAD
2.3.3 C-Mlink
2.3.4 LitLinker
2.3.5 Manjal
2.3.6 BITOLA
2.4 国内非相关文献知识发现系统尝试
2.4.1 汉语非相关文献知识发现试验系统
2.4.2 基于语义的中文非相关文献知识发现辅助系统
2.4.3 非相文献知识发现中间关联集合联优化策略
2.5 总结
第三章 非相关文献知识发现系统关键技术研究
3.1 非相关文献知识发现系统研究的设计目标
3.2 非相关文献知识发现系统的技术分析
3.3 中文自动分词
3.3.1 非相关文献知识发现系统对中文自动分词的要求
3.3.2 中文自动分词解决方案
3.4 词汇过滤方式
3.5 同义词控制
3.6 开始词、中间词和目标词选择
3.6.0 词间关系的表示
3.6.1 开放式过程词的选择
3.6.2 闭合式过程中间词的选择
第四章 非相关文献知识发现系统设计及实现
4.1 非相关文献知识发现系统的总体设计
4.2 非相关文献知识发现系统模块设计
4.2.1 词表管理模块
4.2.2 开放式知识发现模块
4.2.3 闭合式知识发现模块
4.3 非相关文献知识发现系统的实现
4.3.1 开发设计平台
4.3.2 系统介绍
第五章 非相关文献知识发现系统测评
5.1 用于测试的数据集的构建
5.1.1 中文数据集的组成与构建
5.1.2 英文数据集的组成与构建
5.2 开放式非相关文献知识发现过程的复现
5.2.1 中文医学数据集测评
5.2.2 英文医学数据集测评
5.3 闭合式非相关文献知识发现过程的复现
5.3.1 镁/偏头痛测评
5.3.2 鱼油/雷诺氏病测评
5.3.3 Magnesium/Migraine
5.3.4 Fish oil/Raynaud's Syndrome
5.4 分析与讨论
第六章 总结与展望
6.1 所做的主要工作
6.2 本文的创新之处
6.3 存在的问题
6.4 进一步的工作
参考文献
致谢
攻读学位期间发表的学术论文
本文编号:2975669
【文章来源】:南京农业大学江苏省 211工程院校 教育部直属院校
【文章页数】:85 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景
1.2 非相关文献知识发现系统现状
1.3 非相关文献知识发现研究目的和意义
1.4 本文主要研究内容
第二章 非相关文献知识发现系统介绍
2.1 非相关文献知识发现系统概述
2.2 SWANSON和ARROWSMITH
2.2.1 Swanson非相关文献知识发现算法原理
2.2.2 网络版的Arrowsmith使用
2.2.3 Arrowsmith数据处理方式
2.2.4 Arrowsmith系统评价
2.3 其他国外非相关文献知识发现系统
2.3.1 Gordon,Lindsay非相关文献知识发现系统
2.3.2 DAD
2.3.3 C-Mlink
2.3.4 LitLinker
2.3.5 Manjal
2.3.6 BITOLA
2.4 国内非相关文献知识发现系统尝试
2.4.1 汉语非相关文献知识发现试验系统
2.4.2 基于语义的中文非相关文献知识发现辅助系统
2.4.3 非相文献知识发现中间关联集合联优化策略
2.5 总结
第三章 非相关文献知识发现系统关键技术研究
3.1 非相关文献知识发现系统研究的设计目标
3.2 非相关文献知识发现系统的技术分析
3.3 中文自动分词
3.3.1 非相关文献知识发现系统对中文自动分词的要求
3.3.2 中文自动分词解决方案
3.4 词汇过滤方式
3.5 同义词控制
3.6 开始词、中间词和目标词选择
3.6.0 词间关系的表示
3.6.1 开放式过程词的选择
3.6.2 闭合式过程中间词的选择
第四章 非相关文献知识发现系统设计及实现
4.1 非相关文献知识发现系统的总体设计
4.2 非相关文献知识发现系统模块设计
4.2.1 词表管理模块
4.2.2 开放式知识发现模块
4.2.3 闭合式知识发现模块
4.3 非相关文献知识发现系统的实现
4.3.1 开发设计平台
4.3.2 系统介绍
第五章 非相关文献知识发现系统测评
5.1 用于测试的数据集的构建
5.1.1 中文数据集的组成与构建
5.1.2 英文数据集的组成与构建
5.2 开放式非相关文献知识发现过程的复现
5.2.1 中文医学数据集测评
5.2.2 英文医学数据集测评
5.3 闭合式非相关文献知识发现过程的复现
5.3.1 镁/偏头痛测评
5.3.2 鱼油/雷诺氏病测评
5.3.3 Magnesium/Migraine
5.3.4 Fish oil/Raynaud's Syndrome
5.4 分析与讨论
第六章 总结与展望
6.1 所做的主要工作
6.2 本文的创新之处
6.3 存在的问题
6.4 进一步的工作
参考文献
致谢
攻读学位期间发表的学术论文
本文编号:2975669
本文链接:https://www.wllwen.com/tushudanganlunwen/2975669.html