基于深度学习与主动学习的中医术语识别研究
发布时间:2022-02-22 01:57
中医古籍文本中蕴含着丰富的中医临床经验知识,若利用自然语言处理技术对中医古籍进行研究,能够深度挖掘中医领域的文本知识,促进中医知识的整合与创新。命名实体识别作为一种重要的自然语言处理技术可以从文本中识别出关键的命名实体,从而帮助人们快速理解文本中的语义信息并获取相关知识。将命名实体识别技术应用于中医古籍中——即进行中医术语识别,可以便捷地从中医古籍文本中识别出中医术语,从而大大促进现代中医研究者们研究中医古籍的进程,为中医学的文本挖掘和信息检索等研究领域提供支持。中医古籍文本的语法独特而灵活,导致对中医古籍文本进行中医术语识别非常困难,而当前针对中医术语识别的研究非常匮乏,所以如何利用先进的命名实体识别技术解决中医术语识别这一难题是当务之急。目前深度学习模型在命名实体识别等自然语言处理领域中取得了令人瞩目的成果,但是将深度学习模型应用于中医术语识别的相关研究和文献均非常稀缺,因此基于深度学习提出并设计BERT-BiLSTM-CRF模型用于进行中医术语识别。BERT-BiLSTM-CRF模型的设计过程充分结合了迁移学习策略、预训练语言模型以及经典的机器学习模型,在实验中将BERT-BiL...
【文章来源】:北京工业大学北京市211工程院校
【文章页数】:79 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 中医术语识别的研究背景与意义
1.2 国内外相关研究现状
1.2.1 命名实体识别的研究现状
1.2.2 中医术语识别的研究现状
1.3 本文主要内容与组织结构
第2章 中医术语识别相关方法研究
2.1 传统的中医术语识别方法
2.2 基于深度学习的中医术语识别方法
2.3 迁移学习与预训练语言模型
2.3.1 word2vec
2.3.2 BERT
2.4 主动学习算法
2.5 本章小结
第3章 基于深度学习的中医术语识别研究
3.1 中医术语识别数据集的构建
3.2 中医术语识别模型整体框架设计
3.3 中医术语识别模型设计
3.3.1 基于BERT进行语义特征提取
3.3.2 基于BiLSTM进行上下文语义建模
3.3.3 基于CRF进行上下文标签建模
3.4 模型性能对比实验及实验结果分析
3.4.1 实验设置
3.4.2 实验结果及实验结果分析
3.5 本章小节
第4章 基于主动学习的中医术语识别研究
4.1 基于主动学习的中医术语识别研究的意义
4.2 针对中医术语识别的主动学习算法设计
4.2.1 初始化阶段
4.2.2 循环查询阶段
4.3 算法实验及实验结果分析
4.3.1 实验设置
4.3.2 实验结果及实验结果分析
4.4 本章小节
第5章 基于实体粒度的主动学习算法研究
5.1 基于实体粒度的主动学习算法原理
5.2 基于实体粒度的主动学习算法设计
5.2.1 初始化阶段
5.2.2 循环查询阶段
5.3 算法实验及实验结果分析
5.3.1 实验设置
5.3.2 实验结果及实验结果分析
5.4 本章小节
结论
参考文献
攻读硕士学位期间取得的研究成果
致谢
【参考文献】:
期刊论文
[1]融入自注意力机制的社交媒体命名实体识别[J]. 李明扬,孔芳. 清华大学学报(自然科学版). 2019(06)
[2]基于LSTM-CRF的中医医案症状术语识别[J]. 李明浩,刘忠,姚远哲. 计算机应用. 2018(S2)
[3]基于主题标签和CRF的中文微博命名实体识别[J]. 朱颢东,杨立志,丁温雪,冯嘉美. 华中师范大学学报(自然科学版). 2018(03)
[4]CRF与词典相结合的疾病命名实体识别[J]. 龙光宇,徐云. 微型机与应用. 2017(21)
[5]主动学习算法研究进展[J]. 杨文柱,田潇潇,王思乐,张锡忠. 河北大学学报(自然科学版). 2017(02)
[6]基于多特征融合的中文电子病历命名实体识别[J]. 张祥伟,李智. 软件导刊. 2017(02)
[7]基于条件随机场的《伤寒论》中医术语自动识别[J]. 孟洪宇,谢晴宇,常虹,孟庆刚. 北京中医药大学学报. 2015(09)
[8]中文句子评价对象抽取的特征分析研究[J]. 郑敏洁,雷志城,廖祥文,陈国龙. 福州大学学报(自然科学版). 2012(05)
[9]一种中医名词术语自动抽取方法[J]. 张五辈,白宇,王裴岩,张桂平. 沈阳航空航天大学学报. 2011(01)
[10]命名实体识别研究进展综述[J]. 孙镇,王惠临. 现代图书情报技术. 2010(06)
硕士论文
[1]基于递归神经网络的生物医学命名实体识别[D]. 金留可.大连理工大学 2016
[2]基于Attention-Based LSTM模型的文本分类技术的研究[D]. 张冲.南京大学 2016
[3]基于Web挖掘的中医知识发现研究[D]. 赵翔.北京交通大学 2010
[4]基于最大熵模型的中文命名实体识别方法研究[D]. 杨华.哈尔滨工程大学 2008
本文编号:3638460
【文章来源】:北京工业大学北京市211工程院校
【文章页数】:79 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 中医术语识别的研究背景与意义
1.2 国内外相关研究现状
1.2.1 命名实体识别的研究现状
1.2.2 中医术语识别的研究现状
1.3 本文主要内容与组织结构
第2章 中医术语识别相关方法研究
2.1 传统的中医术语识别方法
2.2 基于深度学习的中医术语识别方法
2.3 迁移学习与预训练语言模型
2.3.1 word2vec
2.3.2 BERT
2.4 主动学习算法
2.5 本章小结
第3章 基于深度学习的中医术语识别研究
3.1 中医术语识别数据集的构建
3.2 中医术语识别模型整体框架设计
3.3 中医术语识别模型设计
3.3.1 基于BERT进行语义特征提取
3.3.2 基于BiLSTM进行上下文语义建模
3.3.3 基于CRF进行上下文标签建模
3.4 模型性能对比实验及实验结果分析
3.4.1 实验设置
3.4.2 实验结果及实验结果分析
3.5 本章小节
第4章 基于主动学习的中医术语识别研究
4.1 基于主动学习的中医术语识别研究的意义
4.2 针对中医术语识别的主动学习算法设计
4.2.1 初始化阶段
4.2.2 循环查询阶段
4.3 算法实验及实验结果分析
4.3.1 实验设置
4.3.2 实验结果及实验结果分析
4.4 本章小节
第5章 基于实体粒度的主动学习算法研究
5.1 基于实体粒度的主动学习算法原理
5.2 基于实体粒度的主动学习算法设计
5.2.1 初始化阶段
5.2.2 循环查询阶段
5.3 算法实验及实验结果分析
5.3.1 实验设置
5.3.2 实验结果及实验结果分析
5.4 本章小节
结论
参考文献
攻读硕士学位期间取得的研究成果
致谢
【参考文献】:
期刊论文
[1]融入自注意力机制的社交媒体命名实体识别[J]. 李明扬,孔芳. 清华大学学报(自然科学版). 2019(06)
[2]基于LSTM-CRF的中医医案症状术语识别[J]. 李明浩,刘忠,姚远哲. 计算机应用. 2018(S2)
[3]基于主题标签和CRF的中文微博命名实体识别[J]. 朱颢东,杨立志,丁温雪,冯嘉美. 华中师范大学学报(自然科学版). 2018(03)
[4]CRF与词典相结合的疾病命名实体识别[J]. 龙光宇,徐云. 微型机与应用. 2017(21)
[5]主动学习算法研究进展[J]. 杨文柱,田潇潇,王思乐,张锡忠. 河北大学学报(自然科学版). 2017(02)
[6]基于多特征融合的中文电子病历命名实体识别[J]. 张祥伟,李智. 软件导刊. 2017(02)
[7]基于条件随机场的《伤寒论》中医术语自动识别[J]. 孟洪宇,谢晴宇,常虹,孟庆刚. 北京中医药大学学报. 2015(09)
[8]中文句子评价对象抽取的特征分析研究[J]. 郑敏洁,雷志城,廖祥文,陈国龙. 福州大学学报(自然科学版). 2012(05)
[9]一种中医名词术语自动抽取方法[J]. 张五辈,白宇,王裴岩,张桂平. 沈阳航空航天大学学报. 2011(01)
[10]命名实体识别研究进展综述[J]. 孙镇,王惠临. 现代图书情报技术. 2010(06)
硕士论文
[1]基于递归神经网络的生物医学命名实体识别[D]. 金留可.大连理工大学 2016
[2]基于Attention-Based LSTM模型的文本分类技术的研究[D]. 张冲.南京大学 2016
[3]基于Web挖掘的中医知识发现研究[D]. 赵翔.北京交通大学 2010
[4]基于最大熵模型的中文命名实体识别方法研究[D]. 杨华.哈尔滨工程大学 2008
本文编号:3638460
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3638460.html
最近更新
教材专著