当前位置:主页 > 科技论文 > 软件论文 >

基于生物医学词典的实体表示及其应用研究

发布时间:2022-09-29 13:51
  随着计算机技术和生物技术的高速发展,生物医学文献正以指数方式增长。面对这些海量数据,研究人员迫切希望揭示蕴含于其中的生物医学知识,这一需求推动了生物医学文本挖掘技术的产生与发展。命名实体识别和链接作为其中的一项重要研究,旨在从文本中识别出生物医学实体并将它们映射为唯一的实体标识符。实体识别和链接研究是关系抽取、信息检索、知识库自动填充等任务的首要步骤,具有重要的研究意义。生物医学领域存在丰富的词典资源,能够作为数据驱动方法的补充,建模数据背后隐含的关联逻辑。本文深入探索生物医学词典中的实体名信息、实体描述信息以及实体结构信息的表示方法,重点研究基于实体知识表示的生物医学实体识别和链接任务,主要研究内容如下:研究基于生物医学词典和语言模型相结合的实体识别。分别通过字符匹配和n元匹配算法抽取实体名的词典特征,并映射为低维向量表示。同时,利用语言模型获取上下文特征。探究上述特征表示的组合对实体识别性能的影响。实验表明,词典特征表示有助于生物医学实体的识别,而语言模型的加入能够进一步提高识别的性能。研究基于实体描述文本的实体表示,用于生物医学实体链接。抽取词典中实体的描述文本,基于神经网络学习... 

【文章页数】:71 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
1 绪论
    1.1 研究内容及意义
    1.2 国内外研究现状
        1.2.1 实体识别研究现状
        1.2.2 实体链接研究现状
    1.3 生物医学实体识别和链接语料库
    1.4 评测指标
    1.5 生物医学词典介绍
    1.6 本文主要工作
    1.7 本文组织结构
2 关键技术概述
    2.1 语言模型与词向量
    2.2 卷积神经网络
    2.3 长短时记忆网络
    2.4 Transformer
    2.5 注意力机制
    2.6 自动编码机
    2.7 本章小结
3 基于语义信息的药物疾病关系抽取
    3.1 基于生物医学词典的实体识别系统
        3.1.1 数据预处理
        3.1.2 特征抽取
        3.1.3 语言模型
        3.1.4 实体识别
        3.1.5 后处理
    3.2 实验与分析
        3.2.1 实验设置
        3.2.2 生物医学实体识别模型架构实验
        3.2.3 特征表示在生物医学实体识别模型的性能分析
        3.2.4 与相关研究比较
    3.3 本章小结
4 基于实体描述文本的生物医学实体链接
    4.1 基于实体描述文本的生物医学实体链接系统
        4.1.1 候选生成
        4.1.2 候选排序
    4.2 实验与分析
        4.2.1 文本编码器对实体链接性能的影响
        4.2.2 融合层对实体链接性能的影响
    4.3 本章小结
5 基于实体结构信息的生物医学实体链接
    5.1 基于实体结构信息的生物医学实体链接系统
        5.1.1 实体结构信息
        5.1.2 基于自动编码机的实体表示学习
        5.1.3 实体消歧模型改进
    5.2 实验与分析
        5.2.1 文本编码器对实体链接性能的影响
        5.2.2 融合层对实体链接性能的影响
        5.2.3 实体知识对实体链接性能的影响
        5.2.4 与相关研究的对比
    5.3 本章小结
结论
参考文献
攻读硕士学位期间发表学术论文情况
致谢



本文编号:3682712

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3682712.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户fa6ba***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com