面向医学命名实体识别的深度学习方法研究
发布时间:2021-02-09 09:52
医学命名实体识别在生物医学研究中起着重要作用,近年来围绕医学命名实体识别有大量的研究工作,目前的研究中存在3个问题需要解决。识别精度不够高,新的医学实体数量在快速增加,传统识别方法的精度不够高。计算效率较低,基于深度学习的识别方法在结构上无法实现高效的计算。多类别医学实体识别问题,欠缺识别多类别医学领域命名实体的方法。针对提高医学命名实体识别的精度的问题,提出基于语义的深度学习方法。提出基于字符的BiLSTM-CRF(CBLC)方法,通过字符级别的词嵌入方法捕获单词的内部结构信息。提出语义BiLSTM-CRF(SBLC)方法,使用大量包含语义信息的医学资源训练词嵌入,结合BiLSTM-CRF获取语义结构的上下文和标签之间的关系,结合Ab3P更有效识别缩写。结果表明,CBLC优于广泛使用的条件随机场和词典匹配等基线方法,SBLC方法优于DNorm和TaggerOne在内的先进方法。在语义的基础上,为了解决罕见医学实体识别以及实体标记不一致的问题,首先设计了一种基于Trie树的医学词典查找方法,然后提出两种融合词典注意力的深度学习方法。提出Dic-Att-BiLSTM-CRF(DABLC)...
【文章来源】:广东工业大学广东省
【文章页数】:119 页
【学位级别】:博士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景和意义
1.2 相关研究工作
1.2.1 基于词典的方法
1.2.2 基于机器学习的方法
1.2.3 基于深度学习的方法
1.3 医学NER存在的问题和难点总结
1.4 本研究的创新点
1.5 深度学习相关概念
1.5.1 神经网络
1.5.2 深度学习
1.5.3 神经网络训练算法
1.6 本文工作和章节安排
第二章 面向医学NER的基于语义的深度学习方法
2.1 引言
2.2 基于字符的双向LSTM-CRF方法
2.2.1 字符层学习
2.2.2 单词层学习
2.2.3 CRF层
2.3 基于语义的双向LSTM方法
2.3.1 词嵌入训练
2.3.2 双向LSTM-CRF
2.3.3 语义双向LSTM方法
2.4 实验和分析
2.4.1 字符双向LSTM实验结果
2.4.2 语义双向LSTM实验结果
2.5 本章小结
第三章 面向医学NER的融合词典注意力的深度学习方法
3.1 引言
3.2 词典查找方法
3.2.1 Trie树结构
3.2.2 词典查找方法
3.3 基于词典文档注意力的方法
3.3.1 文档注意力机制
3.3.2 Dic-Att-BiLSTM-CRF方法
3.4 基于词典自注意的方法
3.4.1 门控循环单元
3.4.2 DABGC方法
3.5 实验和分析
3.5.1 词典查找性能实验
3.5.2 词典文档注意力实验
3.5.3 词典自注意力实验
3.6 本章小结
第四章 面向医学NER的加速深度学习方法
4.1 引言
4.2 基于切片门控循环单元的文档级注意力方法
4.2.1 切片GRU网络
4.2.2 Att-SGRU-CRF方法
4.3 基于迭代扩张卷积网络的方法
4.3.1 迭代扩张卷积网络
4.3.2 多头注意力机制
4.3.3 注意力迭代扩张卷积网络
4.4 实验和分析
4.4.1 Att-SGRU-CRF方法实验
4.4.2 迭代扩张卷积网络实验
4.5 本章小结
第五章 面向医学NER的基于文本分类和加权投票的深度学习方法
5.1 引言
5.2 加权投票法
5.2.1 模型集成
5.2.2 投票法
5.2.3 加权投票
5.3 医学文本分类
5.3.1 带秩约束的线性文本分类模型
5.3.2 医学文本的分类和词嵌入训练
5.4 基于加权投票的多模型融合方案
5.4.1 多模型NER方法
5.4.2 多模型加权投票集成方法
5.5 实验和分析
5.6 本章小结
总结和展望
参考文献
攻读博士学位期间发表论文
致谢
本文编号:3025454
【文章来源】:广东工业大学广东省
【文章页数】:119 页
【学位级别】:博士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景和意义
1.2 相关研究工作
1.2.1 基于词典的方法
1.2.2 基于机器学习的方法
1.2.3 基于深度学习的方法
1.3 医学NER存在的问题和难点总结
1.4 本研究的创新点
1.5 深度学习相关概念
1.5.1 神经网络
1.5.2 深度学习
1.5.3 神经网络训练算法
1.6 本文工作和章节安排
第二章 面向医学NER的基于语义的深度学习方法
2.1 引言
2.2 基于字符的双向LSTM-CRF方法
2.2.1 字符层学习
2.2.2 单词层学习
2.2.3 CRF层
2.3 基于语义的双向LSTM方法
2.3.1 词嵌入训练
2.3.2 双向LSTM-CRF
2.3.3 语义双向LSTM方法
2.4 实验和分析
2.4.1 字符双向LSTM实验结果
2.4.2 语义双向LSTM实验结果
2.5 本章小结
第三章 面向医学NER的融合词典注意力的深度学习方法
3.1 引言
3.2 词典查找方法
3.2.1 Trie树结构
3.2.2 词典查找方法
3.3 基于词典文档注意力的方法
3.3.1 文档注意力机制
3.3.2 Dic-Att-BiLSTM-CRF方法
3.4 基于词典自注意的方法
3.4.1 门控循环单元
3.4.2 DABGC方法
3.5 实验和分析
3.5.1 词典查找性能实验
3.5.2 词典文档注意力实验
3.5.3 词典自注意力实验
3.6 本章小结
第四章 面向医学NER的加速深度学习方法
4.1 引言
4.2 基于切片门控循环单元的文档级注意力方法
4.2.1 切片GRU网络
4.2.2 Att-SGRU-CRF方法
4.3 基于迭代扩张卷积网络的方法
4.3.1 迭代扩张卷积网络
4.3.2 多头注意力机制
4.3.3 注意力迭代扩张卷积网络
4.4 实验和分析
4.4.1 Att-SGRU-CRF方法实验
4.4.2 迭代扩张卷积网络实验
4.5 本章小结
第五章 面向医学NER的基于文本分类和加权投票的深度学习方法
5.1 引言
5.2 加权投票法
5.2.1 模型集成
5.2.2 投票法
5.2.3 加权投票
5.3 医学文本分类
5.3.1 带秩约束的线性文本分类模型
5.3.2 医学文本的分类和词嵌入训练
5.4 基于加权投票的多模型融合方案
5.4.1 多模型NER方法
5.4.2 多模型加权投票集成方法
5.5 实验和分析
5.6 本章小结
总结和展望
参考文献
攻读博士学位期间发表论文
致谢
本文编号:3025454
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3025454.html