学术文献检索结果语义模型抽取设计与实现
发布时间:2024-03-10 16:24
文献的关键词检索具有易用性,但由于原有检索结果集中文献的语义和关系的缺失,导致学者仍需对PR(Page Ranking)线性排序的检索结果进行低效率的二次筛选。论文侧重于对学术检索结果集构建文献细粒度语义以及通过细粒度语义定义文献间关系,以此来提高学者二次筛选效率,并将文献细粒度语义模型的实现转化为自然语言处理的实体识别和关系抽取。具体从文献中包含的“所解决的问题和所使用的方法”两个关键信息要素出发,建立问题-方法以及基于此的文献间关系的语义模型,并进一步将文献语义模型映射为文献集展示模型,实现对检索结果文献集的文献知识、文献间语义关系以及PR排序结构的多维度展示,提高学者对检索结果的筛选效率。具体工作包括:1)文献的语义模型和展示模型设计:以问题-方法两个维度描述文献的细粒度语义信息,通过问题-方法、问题-问题和方法-方法的语义关系来表示文献内的语义知识和文献之间的语义关系,因此文献的语义模型能够提供文献集的多粒度、多维度的语义表示;立体化的文献语义模型映射为展示模型,提供多维度、多粒度的文献展示交互图形界面。2)文献语义模型构建:文献的问题-方法模型的构建转化为文献的问题和方法实体...
【文章页数】:88 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.0 研究背景与意义
1.1 研究现状
1.1.1 科学文献领域知识实体识别
1.1.2 科学文献领域知识实体关系抽取
1.2 研究内容
1.3 论文组织结构
第二章 相关技术介绍
2.1 表示学习
2.1.1 词向量表示方式
2.1.2 词向量表示学习方法
2.2 双向长短时记忆网络
2.3 条件随机场
2.4 卷积神经网络
2.4.1 迭代膨胀卷积神经网络
2.4.2 图卷积神经网络
2.5 注意力机制
2.6 本章小结
第三章 文献语义模型与展示模型
3.1 问题-方法的文献语义模型
3.1.1 科学文献内容特征分析
3.1.2 问题-方法的文献语义模型
3.2 文献集展示模型
3.2.1 展示模型构建
3.2.2 模型动态交互设计
3.3 示例展示
3.4 本章小结
第四章 文献语义模型的问题实体和方法实体识别
4.1 引言
4.2 问题描述
4.3 结合多头自注意力的IDCNN-BiLSTM-CRF模型
4.3.1 特征表示层
4.3.2 IDCNN层
4.3.3 Bi LSTM+Self Attention层
4.3.4 CRF层
4.3.5 损失函数
4.4 实验数据准备
4.4.1 数据集介绍
4.4.2 数据集预处理
4.4.3 模型性能指标
4.4.4 实验环境
4.4.5 模型超参设置
4.5 实验设计与结果分析
4.5.1 主流模型对比实验
4.5.2 特征消融对比实验
4.5.3 模块消融实验
4.6 本章小结
第五章 文献模型的语义关系抽取
5.1 引言
5.2 问题描述
5.3 融合句法结构信息的双通道GCN-CNN-Bi LSTM-ATT模型
5.3.1 句法结构提取模块
5.3.2 一般特征提取模块
5.3.3 特征融合和分类模块
5.3.4 损失函数选择
5.4 实验设计与结果分析
5.4.1 数据集处理与标注
5.4.2 模型超参设置
5.4.3 主流模型对比实验
5.4.4 一般特征提取模块输入特征消融对比实验
5.4.5 模块消融实验
5.5 本章小结
第六章 学术文献代理检索系统原型设计与实现
6.1 功能分析
6.2 架构设计
6.3 系统模块设计与实现
6.3.1 检索代理与预处理层
6.3.2 检索结果文献知识抽取层
6.3.3 展示网络构建层
6.3.4 可视层
6.4 系统测试
6.4.1 模块功能测试
6.4.2 集成测试
6.5 本章小结
第七章 总结与展望
7.1 总结
7.2 未来工作
致谢
参考文献
作者简介
本文编号:3925071
【文章页数】:88 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.0 研究背景与意义
1.1 研究现状
1.1.1 科学文献领域知识实体识别
1.1.2 科学文献领域知识实体关系抽取
1.2 研究内容
1.3 论文组织结构
第二章 相关技术介绍
2.1 表示学习
2.1.1 词向量表示方式
2.1.2 词向量表示学习方法
2.2 双向长短时记忆网络
2.3 条件随机场
2.4 卷积神经网络
2.4.1 迭代膨胀卷积神经网络
2.4.2 图卷积神经网络
2.5 注意力机制
2.6 本章小结
第三章 文献语义模型与展示模型
3.1 问题-方法的文献语义模型
3.1.1 科学文献内容特征分析
3.1.2 问题-方法的文献语义模型
3.2 文献集展示模型
3.2.1 展示模型构建
3.2.2 模型动态交互设计
3.3 示例展示
3.4 本章小结
第四章 文献语义模型的问题实体和方法实体识别
4.1 引言
4.2 问题描述
4.3 结合多头自注意力的IDCNN-BiLSTM-CRF模型
4.3.1 特征表示层
4.3.2 IDCNN层
4.3.3 Bi LSTM+Self Attention层
4.3.4 CRF层
4.3.5 损失函数
4.4 实验数据准备
4.4.1 数据集介绍
4.4.2 数据集预处理
4.4.3 模型性能指标
4.4.4 实验环境
4.4.5 模型超参设置
4.5 实验设计与结果分析
4.5.1 主流模型对比实验
4.5.2 特征消融对比实验
4.5.3 模块消融实验
4.6 本章小结
第五章 文献模型的语义关系抽取
5.1 引言
5.2 问题描述
5.3 融合句法结构信息的双通道GCN-CNN-Bi LSTM-ATT模型
5.3.1 句法结构提取模块
5.3.2 一般特征提取模块
5.3.3 特征融合和分类模块
5.3.4 损失函数选择
5.4 实验设计与结果分析
5.4.1 数据集处理与标注
5.4.2 模型超参设置
5.4.3 主流模型对比实验
5.4.4 一般特征提取模块输入特征消融对比实验
5.4.5 模块消融实验
5.5 本章小结
第六章 学术文献代理检索系统原型设计与实现
6.1 功能分析
6.2 架构设计
6.3 系统模块设计与实现
6.3.1 检索代理与预处理层
6.3.2 检索结果文献知识抽取层
6.3.3 展示网络构建层
6.3.4 可视层
6.4 系统测试
6.4.1 模块功能测试
6.4.2 集成测试
6.5 本章小结
第七章 总结与展望
7.1 总结
7.2 未来工作
致谢
参考文献
作者简介
本文编号:3925071
本文链接:https://www.wllwen.com/tushudanganlunwen/3925071.html