生物医学领域实体关系抽取研究

发布时间:2020-12-12 14:28
  生物医学文献和生物医学数据库是生物医学领域知识的主要来源,生物医学文献和数据库中的生物医学实体关系是领域知识的一种表现形式。实体关系将文献中抽象的语义信息转变为结构化的实体信息,不仅方便生物医学领域研究人员对领域知识的获取,还可以实现生物医学信息的自动化处理,推动生物医学领域研究工具的开发及医疗领域的信息化发展。因此,生物医学领域的实体关系抽取是将生物医学领域知识结构化和发现新生物医学知识的重要方法。目前研究工作主要集中在海量生物医学文献中抽取实体关系方法研究,而从生物医学结构化知识中抽取实体关系方法的研究还没有得到广泛的关注。本文以生物医学实体关系抽取为研究主线,研究生物医学文献主题关系模型,抽取文献主题相关的实体关系,进而构建生物医学知识网络,在知识网络上实现基于链路预测的生物医学实体发现方法和基于图神经网络的生物医学实体发现方法,从结构化生物医学数据库中发现实体隐性关系。本文主要的研究内容包含以下几部分:第一,针对当前抽取生物医学实体关系与文献主题相关性不足的问题,研究实现文献主题关系抽取方法,通过建立主题分布模型和实体关系抽取模型,从特定文献中抽取与主题相关的生物医学文献主题关... 

【文章来源】:吉林大学吉林省 211工程院校 985工程院校 教育部直属院校

【文章页数】:125 页

【学位级别】:博士

【部分图文】:

生物医学领域实体关系抽取研究


命名实体识别方法

内容,生物医学,实体关系,文献主题


第1章绪论14基于核函数的方法主要利用文本的结构特征[86]。核函数方法的理念是量化两个实例之间的相似度。常用的核函数有词袋核函数、浅层语义核函数、子树核函数、图核函数和组合核函数。1.3本文主要研究内容图1.2本文主要研究内容概图为充分利用生物医学领域文献和数据库资源,尤其是MEDLINE及各个开源数据库,本文基于信息抽取技术,探索了从生物医学文献中抽取生物医学文献主题关系并构建生物医学知识网络的方法,基于文献主题关系与生物医学文献关联进行关系类文献检索研究,开发基于图神经网络的实体关系发现模型,运用生物医学知识网络辅助文献中实体关系抽龋本文以生物医学领域的实体关系抽取研究为主线,旨在从生物医学文献和生物医学知识网络中发现潜在生物医学实体关系等知识。首先建立生物医学文献主题模型,从文献中抽取文献主题关系。进而,利用现有生物医学数据库及生物医学实体关系,如主题关系等,研究构建生物医学知识网络方法,建立包含多种类型实体的生物医学知识网络。研究生物医学知识网络中的实体关系发现方法,分别建立基于链路预测和基于图神经网络的实体关系发现模型,实现生物医学知识网络中的实体关系发现。本文的主要研究内容如下:(1)研究解决抽取生物医学实体关系及其对应生物医学文献之间关联关系较弱的问题。结合生物医学文献主题发现和关系抽取两个研究领域,提出面向生物医学文献的主题关系抽取模型,从文献中抽取与主题相关的生物医学文献

实体关系图,实体关系,数据库,基因组学


第2章相关工作简介20这就会导致实体关系类数据库中的数据规模比同期的结构化数据库的数据规模要校从数据库获取数据的方式划分,可以分为自动生成式数据库和专家数据库。自动生成数据库方法具有较高的效率,可以在没有或仅有较少人工监督时处理MEDLINE这种大型文献数据库。因此,这种方法可以处理数量巨大的生物医学文献和最新发表的文献,从而获得大量最新的结果。此外,通过使用最新的信息抽取方法可以有效提升这种方法的效果。专家数据库在准确度通常会更加优秀。由于生物医学文献中关系要求较高的准确度,使用自动生成方法完全替代专家审阅的方式在优秀需求下还是很难做到的。通常专家数据库是由一组领域专家或领域研究人员合作构建的方式实现的。它的效率相比自动生成是非常低的,数据库更新会较慢。这种方法在接受新的信息较为耗时,因为需要人工参与,所以一般只在对数据有非常高的准确度需求,或数据规模较孝数据更新较慢时使用。现阶段的实体关系数据库数据规模都比较大,显然已经不再依赖专家参与数据的构建。目前实体关系数据库主要从多个领域知识数据库和生物医学文献中获取新的实体关系。图2.1CTD数据库中实体关系类型比较毒理基因组学数据库[90](ComparativeToxicogenomicsDatabase,CTD)和DisGeNet[91]是目前仍在更新的实体关系数据库。CTD包含6种类型的生物医学实体,包括化学物质、表现型、基因、暴露组学、疾并通路,实体间关系如


本文编号:2912730

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/2912730.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户365f0***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com