基于神经网络的生物医学实体识别及关系抽取
发布时间:2021-01-29 22:51
生物医学命名实体识别和实体关系抽取是生物医学信息抽取领域中基础而关键的任务,为生物医学知识图谱,疾病治疗,药物研发提供关键的信息。近年来,基于深度神经网络的方法已成为生物医学信息抽取的主流方法。相较于传统的统计学习方法,深度神经网络有着自动抽取特征和模型泛化性好的优势。本文基于深度神经网络方法研究了生物医学命名实体识别和药物-药物间关系抽取两个任务。在生物医学命名实体识别任务中存在着实体稀疏性高、边界模糊、含有特殊字符等情况。针对上述问题,本文提出了一种基于CNN-BLSTM-CRF的神经网络模型。该模型通过卷积神经网络(Convolutional Neural Networks,CNN)自动抽取单词的字符级特征,并将单词的字符级特征与词向量结合送入长短时记忆网络(Long Short Term Memory Network,LSTM)学习上下文信息。最后通过条件随机场(Conditional Random Field,CRF)得到一个全局最优的标记序列。本文在两个数据集上的实验证明了该模型的有效性,在BioCreative II GM和JNLPBA语料上分别达到了89.09%和74....
【文章来源】:大连理工大学辽宁省 211工程院校 985工程院校 教育部直属院校
【文章页数】:61 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.2.1 生物医学命名实体识别研究现状
1.2.2 生物医学关系抽取研究现状
1.3 本文研究内容概述
1.4 本文的组织结构
2 相关表示与模型介绍
2.1 词表示
2.1.1 独热码词向量表示
2.1.2 分布式词向量表示
2.2 条件随机场
2.2.1 线性CRF
2.2.2 矩阵形式的线性链CRF
2.3 深度神经网络
2.3.1 前馈神经网络
2.3.2 循环神经网络
2.3.3 卷积神经网络
2.4 评价指标
2.5 本章小结
3 基于CNN-BLSTM-CRF的生物医学命名实体识别
3.1 任务描述
3.2 CNN-BLSTM-CRF模型结构
3.2.1 输入层
3.2.2 字符级卷积层
3.2.3 词向量融合层
3.2.4 BLSTM模块
3.2.5 CRF模块
3.3 实验分析
3.3.1 实验语料介绍
3.3.2 实验参数
3.3.3 实验结果及分析
3.3.4 与现有模型的对比及分析
3.4 本章小结
4 融合知识注意力机制的药物-药物关系抽取模型
4.1 任务介绍及分析
4.2 模型架构
4.2.1 语料预处理
4.2.2 知识获取及编码模块
4.2.3 输入层
4.2.4 GRU编码层
4.2.5 基于外部知识的注意力层
4.2.6 输出层
4.3 实验分析
4.3.1 语料介绍
4.3.2 实验参数
4.3.3 实验结果与分析
4.3.4 与现有模型的对比和分析
4.4 本章小结
结论
参考文献
攻读硕士学位期间发表学术论文情况
致谢
本文编号:3007741
【文章来源】:大连理工大学辽宁省 211工程院校 985工程院校 教育部直属院校
【文章页数】:61 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.2.1 生物医学命名实体识别研究现状
1.2.2 生物医学关系抽取研究现状
1.3 本文研究内容概述
1.4 本文的组织结构
2 相关表示与模型介绍
2.1 词表示
2.1.1 独热码词向量表示
2.1.2 分布式词向量表示
2.2 条件随机场
2.2.1 线性CRF
2.2.2 矩阵形式的线性链CRF
2.3 深度神经网络
2.3.1 前馈神经网络
2.3.2 循环神经网络
2.3.3 卷积神经网络
2.4 评价指标
2.5 本章小结
3 基于CNN-BLSTM-CRF的生物医学命名实体识别
3.1 任务描述
3.2 CNN-BLSTM-CRF模型结构
3.2.1 输入层
3.2.2 字符级卷积层
3.2.3 词向量融合层
3.2.4 BLSTM模块
3.2.5 CRF模块
3.3 实验分析
3.3.1 实验语料介绍
3.3.2 实验参数
3.3.3 实验结果及分析
3.3.4 与现有模型的对比及分析
3.4 本章小结
4 融合知识注意力机制的药物-药物关系抽取模型
4.1 任务介绍及分析
4.2 模型架构
4.2.1 语料预处理
4.2.2 知识获取及编码模块
4.2.3 输入层
4.2.4 GRU编码层
4.2.5 基于外部知识的注意力层
4.2.6 输出层
4.3 实验分析
4.3.1 语料介绍
4.3.2 实验参数
4.3.3 实验结果与分析
4.3.4 与现有模型的对比和分析
4.4 本章小结
结论
参考文献
攻读硕士学位期间发表学术论文情况
致谢
本文编号:3007741
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3007741.html