基于框架的科技文献中事件知识抽取
发布时间:2023-08-08 19:43
数字图书馆作为学术成果的知识库,其保存的海量科技文献作为人类的知识宝藏,成为人们补给知识的重要途径,用户可以不受时空限制及时获取所需知识。然而,随着知识经济时代的到来,人们对知识的需求日益迫切化、专业化、微观化和精准化。目前,传统的以篇章为单位的知识服务导致用户不得不花费大量的时间定位所需知识;并且在深入文献内容研究方面,文本内容划分模糊,最终也会导致知识服务产生了模糊。因此,为满足知识经济时代人们新的知识需求,迎接大数据对数字图书馆科技文献知识服务的影响和挑战,解决科技文献存在的服务粒度过大、内容划分边界模糊等问题,本研究将科技文献知识服务的单位由文献单元深入到文献内容本身,并对它们进行整理、筛选、分析乃至评价等,从而将最相关的知识以最精简的方式提供给用户,满足用户的知识需求。事件知识作为人类认识和理解世界的基本的单元,是人们进行思维活动的基本单元。基于上述分析,本研究以数字图书馆馆藏科技文献中的事件知识为研究对象,运用多种相关理论和研究方法,首先,基于描述规则抽取科技文献中的元事件;然后,对元事件数据集进行聚类分析,识别每一个类簇的表示框架,即事件知识表示框架;最后,基于事件知识表...
【文章页数】:80 页
【学位级别】:硕士
【文章目录】:
摘要
Abstrad
1 绪论
1.1 研究背景及意义
1.1.1 研究背景
1.1.2 研究意义
1.2 国内外研究现状
1.2.1 事件内涵研究现状
1.2.2 事件知识表示研究现状
1.2.3 事件抽取方法研究现状
1.2.4 研究述评
1.3 研究内容和研究思路
1.3.1 研究内容
1.3.2 研究思路
1.4 研究创新点
1.5 论文结构
2 相关理论与关键技术
2.1 事件知识相关概念
2.2 知识表示
2.2.1 符号的知识表示方法
2.2.2 基于符号的事件知识表示
2.3 聚类分析
2.3.1 基于划分的聚类
2.3.2 基于层次的聚类
2.3.3 谱聚类
2.3.4 性能分析
2.4 文本预处理
2.4.1 词法分析
2.4.2 依存句法分析
2.4.3 语义依存分析
2.4.4 文本预处理工具
3 科技文献中元事件的抽取
3.1 元事件初始描述规则的生成
3.1.1 语料库的解析
3.1.2 目标句式结构的识别
3.1.3 句式结构的规范
3.2 元事件的抽取与描述规则的自动更新
3.2.1 基于描述规则的元事件抽取
3.2.2 基于prefixspan算法的元事件描述规则自动更新
3.3 元事件描述规则总结
3.3.1 静态的陈述型元事件描述规则
3.3.2 动态的程序型元事件描述规则
4 科技文献中事件知识的抽取
4.1 科技文献中事件知识的框架识别
4.1.1 事件主题的识别
4.1.2 事件知识框架的识别
4.2 基于框架的构件值抽取
4.2.1 主题标识
4.2.2 内部属性值的识别
4.2.3 情境属性值的识别
4.2.4 外部属性关联的识别
5 实证
5.1 元事件抽取实证分析
5.1.1 测试语料的选取
5.1.2 实验结果
5.1.3 测试评价
5.1.4 抽取结果比较与分析
5.2 事件知识抽取实证分析
5.2.1 测试评价
5.2.2 结果分析
6 总结与展望
6.1 研究总结
6.2 展望
参考文献
攻读学位期间完成的论文
致谢
本文编号:3840369
【文章页数】:80 页
【学位级别】:硕士
【文章目录】:
摘要
Abstrad
1 绪论
1.1 研究背景及意义
1.1.1 研究背景
1.1.2 研究意义
1.2 国内外研究现状
1.2.1 事件内涵研究现状
1.2.2 事件知识表示研究现状
1.2.3 事件抽取方法研究现状
1.2.4 研究述评
1.3 研究内容和研究思路
1.3.1 研究内容
1.3.2 研究思路
1.4 研究创新点
1.5 论文结构
2 相关理论与关键技术
2.1 事件知识相关概念
2.2 知识表示
2.2.1 符号的知识表示方法
2.2.2 基于符号的事件知识表示
2.3 聚类分析
2.3.1 基于划分的聚类
2.3.2 基于层次的聚类
2.3.3 谱聚类
2.3.4 性能分析
2.4 文本预处理
2.4.1 词法分析
2.4.2 依存句法分析
2.4.3 语义依存分析
2.4.4 文本预处理工具
3 科技文献中元事件的抽取
3.1 元事件初始描述规则的生成
3.1.1 语料库的解析
3.1.2 目标句式结构的识别
3.1.3 句式结构的规范
3.2 元事件的抽取与描述规则的自动更新
3.2.1 基于描述规则的元事件抽取
3.2.2 基于prefixspan算法的元事件描述规则自动更新
3.3 元事件描述规则总结
3.3.1 静态的陈述型元事件描述规则
3.3.2 动态的程序型元事件描述规则
4 科技文献中事件知识的抽取
4.1 科技文献中事件知识的框架识别
4.1.1 事件主题的识别
4.1.2 事件知识框架的识别
4.2 基于框架的构件值抽取
4.2.1 主题标识
4.2.2 内部属性值的识别
4.2.3 情境属性值的识别
4.2.4 外部属性关联的识别
5 实证
5.1 元事件抽取实证分析
5.1.1 测试语料的选取
5.1.2 实验结果
5.1.3 测试评价
5.1.4 抽取结果比较与分析
5.2 事件知识抽取实证分析
5.2.1 测试评价
5.2.2 结果分析
6 总结与展望
6.1 研究总结
6.2 展望
参考文献
攻读学位期间完成的论文
致谢
本文编号:3840369
本文链接:https://www.wllwen.com/tushudanganlunwen/3840369.html