当前位置:主页 > 理工论文 > 生物学论文 >

基于神经网络与领域知识的生物医学关系抽取

发布时间:2023-04-01 09:03
  信息抽取技术为处理互联网中存在的海量数据提供了手段。生物医学文献是互联网文本数据的重要组成部分,隐藏在文献背后的知识可以服务于信息检索、推荐系统和问答系统等实际应用领域。关系抽取是用于挖掘文献中蕴含的知识的一种必不可少的技术。本文重点研究生物医学领域的篇章级关系抽取,区别于传统关系抽取局限于抽取单个句子内的实体关系,篇章级关系抽取则是从文献摘要中抽取实体关系,而摘要文本通常由多个句子组成,长度更长,语义更加复杂。本文提出一种基于图卷积神经网络和多头注意力机制的端到端关系抽取方法。为了更好地从长文本中提取特征,构建了文档级别依存图并使用图卷积神经网络对其进行建模,获得了文本的句法结构特征,另一方面使用多头注意力机制从不同的语义子空间中获取与关系抽取任务最相关的文本序列上下文特征,将得到的上下文特征和句法特征融合后用于关系分类。此外,传统的词向量是静态词向量,不能根据上下文确定词的语义表示,而本文使用了深度上下文相关词向量替换传统词向量,解决传统词向量存在的一词多义问题,从而丰富了文本输入特征的表达。除了文本信息以外,现有的生物领域知识也可以为关系抽取提供更多信息。本文提出了基于领域知识的...

【文章页数】:59 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
1 绪论
    1.1 研究背景与意义
    1.2 国内外研究现状
        1.2.1 基于规则模板的研究方法
        1.2.2 基于机器学习的研究方法
        1.2.3 基于深度学习的研究方法
    1.3 本文的研究内容
    1.4 本文的结构安排
2 相关技术知识与资源简介
    2.1 词向量模型
        2.1.1 Word2Vec简介
        2.1.2 ELMo简介
    2.2 深度学习方法
        2.2.1 长短时记忆网络
        2.2.2 图卷积神经网络
        2.2.3 注意力机制
    2.3 篇章级关系抽取介绍
    2.4 相关资源与评价指标
        2.4.1 CDR数据集
        2.4.2 CTD知识库
        2.4.3 评价指标
3 基于神经网络的关系抽取方法
    3.1 引言
    3.2 关系实例的构建
    3.3 文档级别依存图的构建
    3.4 基于神经网络的关系抽取模型
        3.4.1 模型框架
        3.4.2 模型输入层
        3.4.3 BiLSTM层
        3.4.4 多头注意力机制层
        3.4.5 GCN层
        3.4.6 关系分类层
    3.5 关系合并
    3.6 实验设置与结果分析
        3.6.1 实验参数设置
        3.6.2 实验结果与分析
        3.6.3 Multi-head attention可视化分析
    3.7 本章小结
4 基于领域知识的关系抽取方法
    4.1 引言
    4.2 领域知识表示学习
    4.3 基于领域知识的关系抽取模型
        4.3.1 模型框架
        4.3.2 模型输入层
        4.3.3 特征抽取层
        4.3.4 领域知识注意力机制层
        4.3.5 关系分类层
    4.4 关系合并
    4.5 实验设置与结果分析
        4.5.1 实验参数设置
        4.5.2 实验结果与分析
    4.6 本章小结
结论
参考文献
攻读硕士学位期间发表学术论文情况
攻读硕士学位期间所获奖项情况
攻读硕士学位期间参加科研项目情况
致谢



本文编号:3776854

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/swxlw/3776854.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b6d53***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com