生物医学事件中触发词及属性联合识别研究
发布时间:2025-01-09 01:51
目的本研究对生物医学事件中触发词及属性进行联合识别研究,通过构建双向长短期记忆-条件随机场(Bidirectional Long Short-Term Memory-Conditional Random Field,BiLSTM-CRF)模型,将事件触发词及属性的联合识别工作,转化为对句子中单词的序列标注问题,利用词向量、依存关系进行特征学习,并以药物警戒性事件为实证对象,对其结果进行评价,为药物警戒性事件的细粒度抽取工作提供帮助,为相关信息的挖掘工作提供支持。方法通过调研国内外生物医学事件抽取的相关文献,对事件触发词、属性的识别工作展开研究,对其采用的方法进行梳理,确定本研究的识别方法。首先,对生物医学事件语料进行训练集、测试集的划分,并对语料中的单词进行IBO体系标注,标注出不同类型的事件触发词和属性。然后,根据大规模未标注的Pubmed摘要进行词向量的学习,生成词向量特征。之后,通过自然语言处理相关的分析工具Stanford CoreNLP进行句法分析,提取依存关系特征。之后,针对训练集,将词向量特征、依存关系特征输入BiLSTM-CRF模型中,选择合适的参数,通过标注好的事件触发...
【文章页数】:48 页
【学位级别】:硕士
【部分图文】:
本文编号:4024959
【文章页数】:48 页
【学位级别】:硕士
【部分图文】:
图1.1生物医学事件实例
第1章绪论2取的核心。除了基本的事件结构,Thompson等人[11]提出基于事件的研究往往忽略了一些附加信息,这些信息能够决定一个事件是否表示一个事实、假设、实验或者分析结果,是否是新颖的,是否被推测或者否定,我们可以称之为事件的属性。这些附加信息能够更加细粒度地解释一个事件,....
图1.2技术路线图
第1章绪论4图1.2技术路线图1.4论文组织框架根据论文研究思路与研究内容,结构组织如下:第1章绪论。主要介绍本研究的研究背景、研究目的与意义,研究内容这几部分。第2章生物医学事件抽取相关研究。本章主要对生物医学事件抽取的一般流程、国内外相关研究进行介绍。内容包括对生物医学事件中....
图3.1触发词及属性联合识别模型
第3章触发词及属性联合识别研究14第3章生物医学事件中触发词及属性联合识别研究本章提出生物医学事件中触发词及属性的联合识别方法。在前人[61]基于深度学习的触发词识别研究中,BiLSTM-CRF方法的识别效果表现良好,本研究也将联合识别的问题通过BiLSTM-CRF转化为序列标注....
图3.2Skip-gram模型
第3章触发词及属性联合识别研究16图3.2Skip-gram模型(2)依存特征事件触发词及属性除了本身的词向量特征外,还因为在生物医学事件的句子结构中承担的作用不同,其依存特征也是特征选择的重要部分。每种句子成分之间都存在依存关系,根据不同的依存语法关系选用合适的工具进行依存句法....
本文编号:4024959
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/4024959.html