生物医学实体关系抽取算法与应用研究

发布时间:2024-01-25 12:44
  生物医学领域的研究因与人类的健康状况密切相关而受到广泛关注。近年来,生物医学文献的数量呈高速增长的态势。海量的生物医学资源一方面成为生物医学专家的宝贵资源,另一方面,由于人工抽取有用的信息耗时耗力,也一定程度上制约了生物医学研究的效率。基于此,生物医学文本挖掘技术适时出现并解决了这一难题。生物医学实体关系抽取是文本挖掘中的重要任务之一。由于目前主流的关系抽取技术是基于深度学习的单任务学习方法,该方法不能有效利用同一领域的相关任务间的共性,使得模型的性能和泛化能力有限。基于此,在本文的工作中,我们构建了多任务学习模型,分别为全共享多任务模型、私有共享多任务模型和基于Attention机制的主辅多任务模型。多任务模型中的私有网络抽取各个任务的私有特征,共享网络可以抽取多个任务之间的公共特征,对私有特征进行补充和增强。特别是,我们提出的基于Attention机制的主辅多任务模型,根据辅助任务对主任务的影响程度,利用Attention层为每个辅助任务与主任务的共享特征分配权重,最大化的利用了辅助任务的积极影响,同时避免了辅助任务的噪声,提升了模型的分类能力。然后,我们使用基于深度学习的关系抽取...

【文章页数】:75 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
1 绪论
    1.1 研究背景
    1.2 研究现状
        1.2.1 生物医学实体关系抽取研究现状
        1.2.2 知识图谱研究现状
        1.2.3 蛋白质-蛋白质交互关系数据库研究现状
    1.3 本文工作
    1.4 本文结构
2 相关技术与知识
    2.1 相关算法
        2.1.1 单词的向量化表示
        2.1.2 神经网络
    2.2 实验数据集
    2.3 评价指标
3 基于多任务学习的生物医学实体关系抽取
    3.1 引言
    3.2 方法
        3.2.1 单任务模型
        3.2.2 全共享多任务模型
        3.2.3 私有共享多任务模型
        3.2.4 基于Attention机制的主辅多任务模型
    3.3 实验与讨论
        3.3.1 数据集与实验设置
        3.3.2 两两任务间的多任务学习
        3.3.3 所有任务间的多任务学习
        3.3.4 Attention机制在主辅多任务模型中的有效性
        3.3.5 与其他方法的性能比较
    3.4 本章小结
4 原发性肝癌的知识图谱构建及表示学习
    4.1 引言
    4.2 原发性肝癌的知识图谱构建
        4.2.1 知识获取
        4.2.2 知识存储
    4.3 基于原发性肝癌的知识图谱表示学习
        4.3.1 问题引出
        4.3.2 知识图谱表示学习方法
        4.3.3 实验与讨论
    4.4 本章小结
5 人类恶性肿瘤的蛋白质交互关系数据库构建
    5.1 引言
    5.2 数据库构建方法
        5.2.1 生物医学文献PPIs抽取系统介绍
        5.2.2 人类恶性肿瘤相关PPIs抽取步骤
        5.2.3 PPIs结构化数据格式
    5.3 数据库介绍
        5.3.1 数据统计
        5.3.2 数据质量分析
        5.3.3 数据库网站
        5.3.4 数据可视化
    5.4 本章小结
结论
参考文献
攻读硕士学位期间发表学术论文情况
攻读硕士学位期间参加学术评测和获奖情况
攻读硕士学位期间参加科研项目情况
致谢



本文编号:3884841

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3884841.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户235b3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com