当前位置:主页 > 科技论文 > 软件论文 >

面向精准医学知识库的基因—变异—疾病关系抽取技术研究

发布时间:2022-10-19 15:54
  精准医学时代背景下,伴随生物医学领域数据爆发式增长与技术跨越式发展,单纯依赖人工编审的传统知识库构建策略已不合时宜且不切实际,从海量文献中抽取信息和挖掘知识成为近年研究重点与应用热点。经过学术和产业界的积极探索,命名实体识别、术语抽取、关系抽取、事件抽取和共指消解等文本挖掘技术已取得重要进展,然而当面向精准医学知识库构建中的“基因-变异-疾病”关系抽取特定研究任务时,现有的关系抽取方法、模型和算法仍存在诸多局限和不足,难以满足实际需求,主要表现在以下五个方面:(1)命名实体识别算法高度依赖特征工程,特征选择、特征表达和特征预处理过程耗时费力,重要词法特征与句法特征湮没于词性特征、依存特征和上下文特征集合中;(2)关系类型定义单纯考虑医学背景,基于关联强弱或概率高低的分类无法表达上下位关系,缺少顶层关系类型指导关系映射,缺乏底层关系触发指示词表辅助关系定位;(3)缺乏用于“基因-变异-疾病”关系抽取算法研究的标准语料库和易用的语料库构建工具,关系抽取语料库构建主要依靠专家人工编审,专家需要在理解语境内容的基础上,结合先验知识判断不同位置与不同表述实体组合的关系状态与关系类型,语料规模和质... 

【文章页数】:125 页

【学位级别】:博士

【文章目录】:
缩略语表
摘要
Abstract
前言
第一章 融合深度神经网络和传统机器学习的高性能、可拓展“基因-变异-疾病”命名实体识别算法
    1.1 引言
    1.2 材料与方法
        1.2.1 材料
        1.2.2 预处理过程
        1.2.3 神经网络过程
        1.2.4 后处理过程
    1.3 结果与讨论
        1.3.1 性能评价
        1.3.2 不同组件的贡献分析
        1.3.3 错误分析
    1.4 小结
第二章 融合无监督聚类和领域本体限定的多层次、细粒度“基因-变异-疾病”关联关系类型
    2.1 引言
    2.2 材料与方法
        2.2.1 材料
        2.2.2 预处理过程
        2.2.3 语义关系类型构建过程
        2.2.4 语义关系类型评价过程
    2.3 结果与讨论
        2.3.1 构建结果
        2.3.2 覆盖度评价
        2.3.3 指导能力评价
    2.4 小结
第三章 融合远程监督指导与专家人工编审的半自动、高质量“基因-变异-疾病”语料库构建
    3.1 引言
    3.2 材料和方法
        3.2.1 材料
        3.2.2 预处理过程
        3.2.3 机器注释过程
        3.2.4 专家编审过程
    3.3 结果与讨论
        3.3.1 构建结果
        3.3.2 机器注释分析
        3.3.3 专家编审分析
    3.4 小结
第四章 融合深度神经网络与领域先验知识的多实体、跨语句“基因-变异-疾病”关系抽取算法
    4.1 引言
    4.2 材料与方法
        4.2.1 材料
        4.2.2 预处理过程
        4.2.3 神经网络过程
        4.2.4 后处理过程
    4.3 结果与讨论
        4.3.1 性能评价
        4.3.2 不同组件贡献分析
        4.3.3 错误分析
    4.4 小结
第五章 融合异源编审数据与多元标注文献的易交互、可溯源“基因-变异-疾病”知识图谱构建和可视化平台
    5.1 引言
    5.2 材料与方法
        5.2.1 材料
        5.2.2 知识集成过程
        5.2.3 知识存储过程
        5.2.4 知识检索和可视化展示过程
    5.3 结果与讨论
        5.3.1 构建结果
        5.3.2 应用场景
        5.3.3 局限分析
    5.4 小结
第六章 结论与展望
参考文献
附录A ClinVar关系文献分布情况统计表
附录B 语义关系构建选用文献来源汇总表
附录C BERT模型补充词表
附录D “基因-变异-疾病”知识图谱构建和可视化平台
作者在学期间取得的学术成果
附件
主要简历
致谢


【参考文献】:
期刊论文
[1]国外生物医学文本语料库分类及特点研究[J]. 晏归来,安新颖,范少萍,周永称.  医学信息学杂志. 2018(10)
[2]精准医学知识库的构建[J]. 刘雷,王星.  中华医学图书情报杂志. 2018(06)
[3]中国、美国、英国精准医学计划比较研究[J]. 吴思竹,钱庆,杨林.  中国医院管理. 2017(09)
[4]开放环境科技语料库质量评价研究[J]. 屈鹏.  情报理论与实践. 2016(05)
[5]一种基于知识挖掘与知识组织的知识型数据库——中国疾病知识总库之临床医药学知识服务系统介绍[J]. 杨志.  中华医学图书情报杂志. 2008(03)
[6]中国生物医学知识库(全文版)检索与应用[J]. 温华影,高岭,姚延芳,步肇宏.  中国现代医生. 2008(08)
[7]中国医院知识仓库建设与服务标准[J]. 张群山.  中国医院管理. 2003(11)



本文编号:3693659

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3693659.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户fea50***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com