当前位置:主页 > 理工论文 > 生物学论文 >

基于医学文献的微生物关系抽取方法研究

发布时间:2021-08-12 05:29
  微生物遍布于地球的各种生态系统中,它们积极地与环境和群落中的其他成员发生相互作用,从而维持系统的平衡和稳定。构建微生物相互作用网络是表征微生物与群落成员或宿主之间关系的最有效方法之一。其中,微生物相互作用关系抽取是构建网络的基础和关键步骤。随着海量微生物相关的医学文献发表,许多经过实验验证的微生物相互作用信息散布其中。抽取这些信息并将其组织成一个数据库或知识图谱具有重要的意义。文本挖掘技术能够自动提取和整合这些信息,从医学文献中发现隐含的微生物相互作用关系。本文针对微生物关系抽取的文本挖掘方法开展了研究,主要贡献如下:首先,提出了一个基于支持向量机和特征向量的有监督学习方法,用于微生物关系抽取。为了训练模型,标注了一个微生物关系抽取语料库,该语料库包含1005篇源于PubMed的摘要,含有7483个微生物关系实体对,为微生物关系抽取提供了基础。设计了 41种特征,分别是词汇特征、词性特征、依存特征以及逻辑特征。接着采用包裹法进行特征选择,获得了最优特征子集,并构建特征向量作为支持向量机模型的输入。最后,探讨分析了各类特征对微生物关系抽取系统性能的影响,并设计多个相关实验进行对比。实验结... 

【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校

【文章页数】:68 页

【学位级别】:硕士

【部分图文】:

基于医学文献的微生物关系抽取方法研究


图1.〗微生物文本挖掘流程图??微生物命名实体识别旨在从文本中识别出微生物实体的名称,实体消歧则是??消除文献中实体名称存在歧义的问题

模型图,模型,层位,矩阵


__xj_xj_?X??X?VI^^xl^xi^xl'x?/??H/?H/?^?a/?Hi?H/??Fi?Pi?Pi?Pi?r'??…H.?,?X?X?X?X?X?X??Embedd,ng,ayer?X?X?X?X?X?X??s^A?L」?k-J?L_J?L.J??the?inleraciion?between?ME?一?ID?丨?and?MEIDI??Feature?layer?-3-2-10?1?2??-5?-4?-3?-2?-1?0??图4.2?Max-Bi-LSTM模型的整体结构??(2)?嵌入层(Embedding?Layer)??嵌入层位于整个模型的第二层,其功能是利用查找或嵌入矩阵,将每个离散??的特征映射到向量表示。预训练的词向量用于表示词嵌入矩阵,其他的特征矩阵??用初始化获得初始值。假设岣作为第i个特征的嵌入矩阵,的每一列为第i个??特征的向量的值。本文将底层的独热表示的特征向量映射到它对应的嵌入矩阵。??令〇;W为第i个特征的第j个特征值的独热编码表示,并作为嵌入层的输入。于是,??嵌入层的输出V由以下公式可以获得:??36??

过程图,模型,过程,生物医学


?碩士学位论文??MASTER'S?THESIS?????为了解决以上问题,在2020年年初,有研究者提出了一个用于生物医学文本??挖掘的预训练的语言表示模型BioBERT,它的预训练和微调过程如图4.3所示[57]。??首先,利用通用领域的BERT进行BioBERT模型的初始化,之后利用生物医学领??域的数据库(PubMed的摘要文献和PMC的全文文献)进行BioBERT模型的训??练,并将其应用到多个生物文本挖掘任务上,并且取的优异的结果。因此BioBERT??值得在本文的微生物关系抽取任务上进行尝试。??鉴于BioBERT的预训练过程需要极大的运算成本和时间成本,因此本文是通??过调用BioBERT预训练好的权重,再进行微调运用到下游的微生物关系抽取任务??上。??Pre-training?of?BioBERT?Fine-tuning?of?BioBERT??Pre-training?Corpora?BioBERT?Pre-training?Task-Specific?Datasets?BioBERT?Fine-tuning??PublCjed?4.5B?words?Named?Entity?Recognition?f?the?adult?renal?failure?cause?..,1??'X.?:?1::?NCBI?disease,?BQGM,???I???O?O?B?\?0??PMC?13.5B?words??????_丨______’?,一——?-???J???—???^?'?j?fT ̄— ̄一—?—y?丨:??Weight?Initialization?Relati


本文编号:3337682

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/swxlw/3337682.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户fbc9f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com