融合结构信息的小样本关系抽取技术研究

发布时间:2021-08-11 16:23
  互联网上存在着大量具有重要价值的非结构化文本数据,需要使用信息抽取技术将其转换为结构化知识。关系抽取是信息抽取技术的基础任务之一。关系抽取任务旨在将非结构化的自然语言文本转化为结构化的三元组,以便于人们使用计算机进行高效地处理、存储和检索。基于有监督学习的关系抽取方法要求具有足够多且完全标注的训练数据,但现实中往往缺乏大量人工标注数据。尽管远程监督模型可以通过对齐知识库获取大量数据,其依然无法从本质上解决样本分布的长尾问题。针对上述挑战,本文在小样本场景的设定下,从两个角度分别提出了两种方法进行研究:(1)融合结构信息的小样本关系抽取方法。为了解决真实场景中样本分布的长尾问题,针对小样本场景的特点,此模型使用一种非参数估计方法。该非参数估计方法认为每个类都存在一个类原型,并通过预先定义的度量函数来计算查询样本与类原型之间的相似度。由于通用的特征提取方式往往会忽略句子的结构信息,此模型对句子的依存关系树进行建模,利用图卷积网络从依存关系树中提取结构信息,并将该结构信息融合到小样本关系抽取模型中。(2)基于动态度量的小样本关系抽取方法。由于非参数估计方法中的度量函数是人为规定的,该方法并不... 

【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校

【文章页数】:81 页

【学位级别】:硕士

【部分图文】:

融合结构信息的小样本关系抽取技术研究


图2.1关系抽取的前导任务??

框架图,小节,框架,方法


__殖:辨位论文?第2#国内外研究现犾??程监督方法则通过自动对齐知识库获取大暈有标签训练数据;??(2)单词的向:量表示:对有标餐句子进行分词处理,并将每个单词映射成一个??词向量>?有时会考虑单词与句子中实体对之间的相对距离,也就是说,将??相对距离作为一种位置向量,并与词向量组合到一起,形成单词最终的向??量表.示;??(3)特征提取:将一个旬子中:所有单词的向暈表示组.合到一起,餐.到句_子的向??_表示,接着输入到神经网络中,利用神经网络模型提取句子特征,最终??训练得到一个特征提取器;??(4)关系分类:根据预先定义好的封闭关系集合,将提取的句子特征向量作为??非线性层的输入,进行关系分类,抽取实体对之间的关系类别;??(5)性能评估:最后,利用相关评测指标对模型性能进行评估。??基?步纖5:性能评估??于??^?步骤4:关系分类??学??步骤3:特征提取??系??#?步骤2.:单词的向慧讓示??取??框??*?步骤:h有标签数据??图2.2?_于深_度学洶的关系抽取框架??接下来,本小节将依次介绍近年来基于深度学习的关系抽取方法,包括基于??卷积神经网络的方法、基于循环神经网络的方法和其他方法。??2.2.1基于卷积神经网络的方法??对卷积神经网络(Convolutional?Neural?Network,CNN)的研究始于20世纪??8??

融合结构信息的小样本关系抽取技术研究


图2.3_循环神■网'络示纛國_??


本文编号:3336491

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3336491.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1e3b5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com