疾病名称识别和规范化

发布时间:2024-07-07 04:02
  近年来,随着生物医学实验方法的变革,生物医学方面的实验数据和文献资料呈指数级增长,如何从如此庞大的科学文献数据中快速有效地抽取有价值的信息,是当前亟待解决的问题。生物医学领域(如基因/蛋白质、化学物和疾病等)的实体识别与规范化是生物医学文本挖掘的基础,它对生物医学实体关系的抽取和生物医学知识库的建立等方面都有着重要的研究意义。其中,疾病名称识别与规范化是从生物医学文献资料中自动抽取疾病名称并且链接到指定疾病数据库中。针对这一任务,本文进行了以下三个方面的研究工作:(1)基于句法和语义特征的疾病名称识别。针对目前疾病名称识别中存在的问题,在条件随机场模型的基础上,提出了一系列新的句法特征和语义特征来获取疾病名称在句子中的结构信息以及在数据库中的语义信息。实验结果表明,本文的特征能够在疾病实体识别任务中取得较好的结果。(2)基于深度学习的疾病名称识别。为了缓解传统机器学习中特征稀疏性问题,本文采用了高性能的深度学习模型BiLSTM-CRF来实现疾病名称识别,探讨了不同的句法特征以及语义特征对疾病名称识别的影响。实验表明,深度学习模型获得了与当前最高性能相当的结果。(3)基于上下文信息的疾病...

【文章页数】:73 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第一章 绪论
    1.1 研究背景与意义
    1.2 课题研究现状
        1.2.1 生物医学领域的疾病名称识别
        1.2.2 生物医学领域的疾病名称规范化
    1.3 研究内容
    1.4 文章组织结构
第二章 相关知识方法
    2.1 相关实验方法
        2.1.1 条件随机场
        2.1.2 循环神经网络
        2.1.3 卷积神经网络
        2.1.4 注意力机制
    2.2 相关工具及资源
        2.2.1 句法分析器
        2.2.2 缩写识别工具
        2.2.3 复合物识别工具
        2.2.4 疾病词典
        2.2.5 深度学习开源框架
第三章 基于句法和语义特征的疾病名称识别
    3.1 疾病名称识别介绍
        3.1.1 任务描述
        3.1.2 疾病名称识别难点
    3.2 疾病名称识别框架
    3.3 特征提取
        3.3.1 词法特征
        3.3.2 句法特征
        3.3.3 语义特征
    3.4 实验
        3.4.1 实验语料
        3.4.2 评估标准
        3.4.3 语料预处理
        3.4.4 实验结果
    3.5 本章小结
第四章 基于深度学习的疾病名称识别
    4.1 疾病名称识别模型
    4.2 特征提取
        4.2.1 词法特征(MOR)
        4.2.2 句法特征(SYN)
        4.2.3 语义特征(SEM)
    4.3 实验
        4.3.1 参数设置
        4.3.2 实验结果
    4.4 本章小结
第五章 基于上下文信息的疾病名称规范化
    5.1 疾病规范化介绍
        5.1.1 任务描述
        5.1.2 任务难点
    5.2 疾病名称规范化
        5.2.1 数据预处理
        5.2.2 候选集生成
        5.2.3 候选集消歧
    5.3 实验
        5.3.1 实验语料
        5.3.2 评估标准
        5.3.3 实验结果
    5.4 本章小结
第六章 总结与展望
    6.1 工作总结
    6.2 工作展望
参考文献
攻读硕士学位期间的研究成果
致谢



本文编号:4003125

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/4003125.html

上一篇:三角网格孔洞修补算法研究  
下一篇:没有了

Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ce666***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com