生物医学实体关系抽取算法与应用研究
发布时间:2024-01-25 12:44
生物医学领域的研究因与人类的健康状况密切相关而受到广泛关注。近年来,生物医学文献的数量呈高速增长的态势。海量的生物医学资源一方面成为生物医学专家的宝贵资源,另一方面,由于人工抽取有用的信息耗时耗力,也一定程度上制约了生物医学研究的效率。基于此,生物医学文本挖掘技术适时出现并解决了这一难题。生物医学实体关系抽取是文本挖掘中的重要任务之一。由于目前主流的关系抽取技术是基于深度学习的单任务学习方法,该方法不能有效利用同一领域的相关任务间的共性,使得模型的性能和泛化能力有限。基于此,在本文的工作中,我们构建了多任务学习模型,分别为全共享多任务模型、私有共享多任务模型和基于Attention机制的主辅多任务模型。多任务模型中的私有网络抽取各个任务的私有特征,共享网络可以抽取多个任务之间的公共特征,对私有特征进行补充和增强。特别是,我们提出的基于Attention机制的主辅多任务模型,根据辅助任务对主任务的影响程度,利用Attention层为每个辅助任务与主任务的共享特征分配权重,最大化的利用了辅助任务的积极影响,同时避免了辅助任务的噪声,提升了模型的分类能力。然后,我们使用基于深度学习的关系抽取...
【文章页数】:75 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景
1.2 研究现状
1.2.1 生物医学实体关系抽取研究现状
1.2.2 知识图谱研究现状
1.2.3 蛋白质-蛋白质交互关系数据库研究现状
1.3 本文工作
1.4 本文结构
2 相关技术与知识
2.1 相关算法
2.1.1 单词的向量化表示
2.1.2 神经网络
2.2 实验数据集
2.3 评价指标
3 基于多任务学习的生物医学实体关系抽取
3.1 引言
3.2 方法
3.2.1 单任务模型
3.2.2 全共享多任务模型
3.2.3 私有共享多任务模型
3.2.4 基于Attention机制的主辅多任务模型
3.3 实验与讨论
3.3.1 数据集与实验设置
3.3.2 两两任务间的多任务学习
3.3.3 所有任务间的多任务学习
3.3.4 Attention机制在主辅多任务模型中的有效性
3.3.5 与其他方法的性能比较
3.4 本章小结
4 原发性肝癌的知识图谱构建及表示学习
4.1 引言
4.2 原发性肝癌的知识图谱构建
4.2.1 知识获取
4.2.2 知识存储
4.3 基于原发性肝癌的知识图谱表示学习
4.3.1 问题引出
4.3.2 知识图谱表示学习方法
4.3.3 实验与讨论
4.4 本章小结
5 人类恶性肿瘤的蛋白质交互关系数据库构建
5.1 引言
5.2 数据库构建方法
5.2.1 生物医学文献PPIs抽取系统介绍
5.2.2 人类恶性肿瘤相关PPIs抽取步骤
5.2.3 PPIs结构化数据格式
5.3 数据库介绍
5.3.1 数据统计
5.3.2 数据质量分析
5.3.3 数据库网站
5.3.4 数据可视化
5.4 本章小结
结论
参考文献
攻读硕士学位期间发表学术论文情况
攻读硕士学位期间参加学术评测和获奖情况
攻读硕士学位期间参加科研项目情况
致谢
本文编号:3884841
【文章页数】:75 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景
1.2 研究现状
1.2.1 生物医学实体关系抽取研究现状
1.2.2 知识图谱研究现状
1.2.3 蛋白质-蛋白质交互关系数据库研究现状
1.3 本文工作
1.4 本文结构
2 相关技术与知识
2.1 相关算法
2.1.1 单词的向量化表示
2.1.2 神经网络
2.2 实验数据集
2.3 评价指标
3 基于多任务学习的生物医学实体关系抽取
3.1 引言
3.2 方法
3.2.1 单任务模型
3.2.2 全共享多任务模型
3.2.3 私有共享多任务模型
3.2.4 基于Attention机制的主辅多任务模型
3.3 实验与讨论
3.3.1 数据集与实验设置
3.3.2 两两任务间的多任务学习
3.3.3 所有任务间的多任务学习
3.3.4 Attention机制在主辅多任务模型中的有效性
3.3.5 与其他方法的性能比较
3.4 本章小结
4 原发性肝癌的知识图谱构建及表示学习
4.1 引言
4.2 原发性肝癌的知识图谱构建
4.2.1 知识获取
4.2.2 知识存储
4.3 基于原发性肝癌的知识图谱表示学习
4.3.1 问题引出
4.3.2 知识图谱表示学习方法
4.3.3 实验与讨论
4.4 本章小结
5 人类恶性肿瘤的蛋白质交互关系数据库构建
5.1 引言
5.2 数据库构建方法
5.2.1 生物医学文献PPIs抽取系统介绍
5.2.2 人类恶性肿瘤相关PPIs抽取步骤
5.2.3 PPIs结构化数据格式
5.3 数据库介绍
5.3.1 数据统计
5.3.2 数据质量分析
5.3.3 数据库网站
5.3.4 数据可视化
5.4 本章小结
结论
参考文献
攻读硕士学位期间发表学术论文情况
攻读硕士学位期间参加学术评测和获奖情况
攻读硕士学位期间参加科研项目情况
致谢
本文编号:3884841
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3884841.html
最近更新
教材专著