基于联合学习的医疗实体与关系抽取方法研究

发布时间:2022-04-25 21:11
  近年来,随着人工智能化的广泛应用,医疗信息化和自动化也逐渐引起了广泛关注。在医疗健康领域,药品说明书相对于公开医疗领域文本,书写良好、权威、全面,虽然数据规模较小,但含有大量的医疗专业术语和语义信息,具有明显的医疗领域特征。目前医疗领域的研究多集中在英文数据集,由于中文句法和语义的特殊性,中文医疗领域的研究更加复杂和困难。本文以抗菌类药品说明书为对象,自主构建了中文药品说明书数据集。当前阶段针对医疗健康领域的相关研究主要集中在命名实体识别和关系抽取两个方面。在以往工作中,大多采用了流水线模式:输入一个句子,先进行命名实体识别,再进行关系抽取。此类模式忽略了任务间联系并造成了错误传播,同时该模式需要大量的人工操作。针对流水线模式的诸多弊端,本文引入了联合学习模式,将卷积神经网络与支持向量机、条件随机场相结合,构建了联合神经网络模型,在此模型基础上,以参数共享的方式,对实体分类与关系抽取两个任务进行联合学习。更进一步,本文基于双向长短时记忆循环神经网络构建了全新的联合模型,模型在未依赖任何人工特征和NLP工具的前提下,能够完全抽取所有实体及关系,同时我们首次将自注意力机制加入到联合任务中,... 

【文章页数】:53 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第1章 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
    1.3 本文的主要工作与创新点
    1.4 论文组织
第2章 数据处理与表示
    2.1 医疗实体及医疗实体关系
    2.2 语料标注
    2.3 中文数据集
    2.4 本章小结
第3章 基于CNN的联合模型
    3.1 模型综述
    3.2 数据预处理
    3.3 深度特征
    3.4 联合方式
        3.4.1 任务联合
        3.4.2 特征联合
        3.4.3 模型联合
    3.5 实验结果
        3.5.1 数据集
        3.5.2 评价指标
        3.5.3 结果分析
    3.6 本章小结
第4章 基于LSTM与 Self-attention的联合学习
    4.1 模型综述
        4.1.1 Self-attention层
        4.1.2 Bi LSTM层
        4.1.3 NER层
        4.1.4 Sigmoid层
    4.2 实验背景
        4.2.1 数据集
        4.2.2 实验设置
    4.3 实验结果
    4.4 错误分析
    4.5 本章小结
第5章 结论与展望
    5.1 结论
    5.2 展望
致谢
参考文献
附录1 攻读学位期间的研究成果
详细摘要


【参考文献】:
期刊论文
[1]融入自注意力机制的社交媒体命名实体识别[J]. 李明扬,孔芳.  清华大学学报(自然科学版). 2019(06)
[2]基于CNN-BLSTM-CRF模型的生物医学命名实体识别[J]. 李丽双,郭元凯.  中文信息学报. 2018(01)

博士论文
[1]生物事件抽取联合模型研究[D]. 魏小梅.武汉大学 2016

硕士论文
[1]基于并行多池化CNN的生物医学事件抽取[D]. 秦美越.大连理工大学 2017



本文编号:3648347

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3648347.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户23aa2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com