阿尔兹海默症知识图谱构建及知识发现

发布时间:2022-02-14 13:04
  阿尔兹海默症是一种常见的老年疾病。据报道在2015年间阿尔兹海默症导致了190万人的死亡,并且该疾病的治疗费用较高。到目前为止,还未有有效治疗或控制该疾病的相关报道。为了找到有效的治疗方法,大量生物医学实验在不断的进行中,大量研究论文不断涌现。然而,2018年1月新英格兰杂志宣布,最有可能的特效药临床试验失败。因此,有必要对过去该疾病的研究思路重新梳理、分析并发现新研究方向。本文针对PubMed数据库中,从2000年到2019年共132,749篇与阿尔兹海默症相关的摘要数据,采用机器学习方法进行知识抽取,构建阿尔兹海默症的知识图谱并进行知识发现。知识图谱的构建模型如下:首先从PubMed数据库下载阿尔兹海默症文献数据,并提取摘要;然后基于主题模型、词向量模型、聚类模型以及命名实体识别的方法,抽取出实体、实体之间的关系以及实体属性等知识;最终利用图数据库将抽取的知识进行存储和展示。同时从时间维度出发,根据实体在时间维度上的变化实现相关知识发现。实验最终识别出16类,共计775个实体。通过实体在文献中的共现情况,定义了“治疗”、“引发”、“并发症”、“行为”、“诊断”和“研究区域”六种关系... 

【文章来源】:吉林大学吉林省211工程院校985工程院校教育部直属院校

【文章页数】:65 页

【学位级别】:硕士

【部分图文】:

阿尔兹海默症知识图谱构建及知识发现


知识图谱框架图

框架图,主题,框架图,模型


第2章知识图谱相关理论和技术8(2)从狄利克雷分布α中取样生成文档的主题分布。(3)从主题的多项式分布中取样生成文档的第j个单词的主题,。(4)从狄利克雷分布β中取样生成主题,对应的词语分布,。(5)从词语的多项式分布,中采用最终生成词语,。图2.2主题模型框架图通过主题模型的框架图可以得到联合概率分布公式(2.1),其中(|α)表示主题采样的过程,具体为根据先验分布参数α对主题进行采样,(|,)表示采样单词的过程,即根据确定的主题z和单词分布的先验分布参数β对单词进行采样。(,|,)=(|,)(|)…………………………………………(2.1)

模型结构,单词,向量


第2章知识图谱相关理论和技术11本体构建本质是将实体进行规范化,明确定义实体及实体之间的关系。本体构建可以通过多种方式完成,例如人工手动编辑构建,或者可以通过计算机辅助,以数据驱动方式自动构建。对于领域知识图谱,一般是领域研究人员人工构建。质量评估是对构建的知识图谱的一个评价过程,即量化融合后的知识图谱的可信度,主要思想是通过将置信度较低的数据进行丢弃,保留置信度较高的数据,从而保障融合后的数据的质量水平。在知识融合过程中,实体对齐的一种实现方式是采用Word2vec与聚类算法结合。Word2vec模型是一个基于三层神经网络的词向量模型,是由Mikolov于2013年提出的[52],通过非监督训练将文本中的每个单词映射到一个k维向量空间,并把每个单词在这个k维空间的表示组合在一起作为该单词的向量表示,其中词向量的含义是语义越相近在向量维度上的距离越相近。Word2vec的具体实现结构有两种,分别为skip-gram模型和连续词袋模型(ContinuousBagofWords,CBOW),这两种结构构建形式类似,均由输入层、投影层和输出层构成,具体的结构如图2.3所示。图2.3CBOW和Skip-gram模型结构图CBOW模型是一个基于上下文预测当前的目标单词向量模型,输入层中w(t-2)、w(t-1)、w(t+1)、w(t+2)表示的需要计算的目标单词w(t)的上下文单词对应的向量表示,隐层主

【参考文献】:
期刊论文
[1]信息组织4.0:变革历程和未来图景[J]. 魏敏.  国家图书馆学刊. 2018(01)
[2]浅谈大数据时代背景下企业档案工作[J]. 张琳.  办公室业务. 2018(02)
[3]基于WLabeled-LDA模型的文本分类研究[J]. 卜天然.  长春师范大学学报. 2017(04)
[4]知识图谱技术综述[J]. 徐增林,盛泳潘,贺丽荣,王雅芳.  电子科技大学学报. 2016(04)
[5]无指导的中文开放式实体关系抽取[J]. 秦兵,刘安安,刘挺.  计算机研究与发展. 2015(05)
[6]阿尔兹海默病的研究现状[J]. 李润辉.  沈阳医学院学报. 2013(03)
[7]老年痴呆的发病机理及治疗策略[J]. 张均田.  药学学报. 2000(08)

硕士论文
[1]基于吉布斯采样的模体识别算法研究[D]. 戈鲁宁.西安电子科技大学 2010



本文编号:3624611

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3624611.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户7eefe***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com