基于框架语义的共指消解研究
发布时间:2021-07-06 04:15
汉语框架网(CFN)作为一种框架语义资源,广泛应用于阅读理解、问答系统等自然语言处理研究领域中。构建汉语篇章句子中框架元素之间的联系是语义理解的一种有效手段,但框架元素内部表述的共指阻碍了这种联系的建立。本文以框架元素中的表述为研究对象,基于框架语义信息,研究表述间的共指关系。本文以社科基金项目“面向机器阅读的汉语框架语义知识库扩建研究”课题为依托,针对构建的汉语框架语义篇章语料中不同框架元素之间存在共指关系的问题,研究基于框架语义的共指消解方法,最后将共指消解方法运用于汉语框架共指语料的标注和检验。本文通过融合汉语框架的语义信息,采用传统的机器学习和目前流行的深度学习等不同方法,在标注共指信息的汉语框架篇章句子语料上进行实验。本文的主要工作及研究成果如下:针对构建的框架语义篇章语料集,框架元素内表述的消解任务,提出并验证了两种方法。(1)基于框架语义的传统机器学习共指消解方法。本文分析了框架元素标注信息及框架之间的关系,得到框架特征集作为框架语义信息,结合共指消解基础特征集,训练共指消解分类模型,准确率得到提升。(2)基于框架语义的深度学习共指消解方法。首先学习表述的上下文文本信息,...
【文章来源】:山西大学山西省
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
基于框架语义的共指消解框架图
第四章基于框架语义的深度学习共指消解方法21第四章基于框架语义的深度学习共指消解方法本章在LSTM模型的基础上,加入框架语义信息,提出基于LSTM共指消解方法。汉语框架标注资源作为知识能更好的应用深度学习解决共指问题,但标注的框架资源无法直接参与计算,要想通过深度学习的算法处理,首先需要用合适的方法将标注的信息经过自然语言符号的数学化表示之后,再完成深度学习模型的训练。4.1用三元组表示汉语框架知识为了方便框架语义的处理和计算机理解,本文采用结构化、形式化的方式表示框架语义信息,使用类似三元组的方式。三元组是知识表示中最常见的格式,汉语框架网作为知识库的一种,在资源中有实体和关系标注,可以简单的把框架关系理解为(实体,关系,实体)三元组。如果把框架中的实体表述看作是结点,把表述在框架中的关系看作是一条边,那么包含了大量三元组的框架知识库就成为了一个庞大的框架知识图。下面介绍汉语框架网中两种关系类型。截取表2.2的部分语料,构建汉语框架核心元素关系图(图4.1)和偏好选择关系图(图4.2)。图4.1汉语框架核心元素关系图图4.1中表示的是汉语框架网中框架与框架内的核心框架元素。本文认为,框架元素表示一段文本或者一句话中最重要的语义成分,其内容更容易与其他成分存在共指关系,特别是在段落或者篇章中,这种关系更加明显。如上所示的框架核心元素表示成三元组(春生子,状态,长白山溪流中的小鱼),(它们,死亡,NULL),(人们,命名,它们),(人们,命名,鱼食)等。图4.2选择偏好关系图
第四章基于框架语义的深度学习共指消解方法21第四章基于框架语义的深度学习共指消解方法本章在LSTM模型的基础上,加入框架语义信息,提出基于LSTM共指消解方法。汉语框架标注资源作为知识能更好的应用深度学习解决共指问题,但标注的框架资源无法直接参与计算,要想通过深度学习的算法处理,首先需要用合适的方法将标注的信息经过自然语言符号的数学化表示之后,再完成深度学习模型的训练。4.1用三元组表示汉语框架知识为了方便框架语义的处理和计算机理解,本文采用结构化、形式化的方式表示框架语义信息,使用类似三元组的方式。三元组是知识表示中最常见的格式,汉语框架网作为知识库的一种,在资源中有实体和关系标注,可以简单的把框架关系理解为(实体,关系,实体)三元组。如果把框架中的实体表述看作是结点,把表述在框架中的关系看作是一条边,那么包含了大量三元组的框架知识库就成为了一个庞大的框架知识图。下面介绍汉语框架网中两种关系类型。截取表2.2的部分语料,构建汉语框架核心元素关系图(图4.1)和偏好选择关系图(图4.2)。图4.1汉语框架核心元素关系图图4.1中表示的是汉语框架网中框架与框架内的核心框架元素。本文认为,框架元素表示一段文本或者一句话中最重要的语义成分,其内容更容易与其他成分存在共指关系,特别是在段落或者篇章中,这种关系更加明显。如上所示的框架核心元素表示成三元组(春生子,状态,长白山溪流中的小鱼),(它们,死亡,NULL),(人们,命名,它们),(人们,命名,鱼食)等。图4.2选择偏好关系图
本文编号:3267502
【文章来源】:山西大学山西省
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
基于框架语义的共指消解框架图
第四章基于框架语义的深度学习共指消解方法21第四章基于框架语义的深度学习共指消解方法本章在LSTM模型的基础上,加入框架语义信息,提出基于LSTM共指消解方法。汉语框架标注资源作为知识能更好的应用深度学习解决共指问题,但标注的框架资源无法直接参与计算,要想通过深度学习的算法处理,首先需要用合适的方法将标注的信息经过自然语言符号的数学化表示之后,再完成深度学习模型的训练。4.1用三元组表示汉语框架知识为了方便框架语义的处理和计算机理解,本文采用结构化、形式化的方式表示框架语义信息,使用类似三元组的方式。三元组是知识表示中最常见的格式,汉语框架网作为知识库的一种,在资源中有实体和关系标注,可以简单的把框架关系理解为(实体,关系,实体)三元组。如果把框架中的实体表述看作是结点,把表述在框架中的关系看作是一条边,那么包含了大量三元组的框架知识库就成为了一个庞大的框架知识图。下面介绍汉语框架网中两种关系类型。截取表2.2的部分语料,构建汉语框架核心元素关系图(图4.1)和偏好选择关系图(图4.2)。图4.1汉语框架核心元素关系图图4.1中表示的是汉语框架网中框架与框架内的核心框架元素。本文认为,框架元素表示一段文本或者一句话中最重要的语义成分,其内容更容易与其他成分存在共指关系,特别是在段落或者篇章中,这种关系更加明显。如上所示的框架核心元素表示成三元组(春生子,状态,长白山溪流中的小鱼),(它们,死亡,NULL),(人们,命名,它们),(人们,命名,鱼食)等。图4.2选择偏好关系图
第四章基于框架语义的深度学习共指消解方法21第四章基于框架语义的深度学习共指消解方法本章在LSTM模型的基础上,加入框架语义信息,提出基于LSTM共指消解方法。汉语框架标注资源作为知识能更好的应用深度学习解决共指问题,但标注的框架资源无法直接参与计算,要想通过深度学习的算法处理,首先需要用合适的方法将标注的信息经过自然语言符号的数学化表示之后,再完成深度学习模型的训练。4.1用三元组表示汉语框架知识为了方便框架语义的处理和计算机理解,本文采用结构化、形式化的方式表示框架语义信息,使用类似三元组的方式。三元组是知识表示中最常见的格式,汉语框架网作为知识库的一种,在资源中有实体和关系标注,可以简单的把框架关系理解为(实体,关系,实体)三元组。如果把框架中的实体表述看作是结点,把表述在框架中的关系看作是一条边,那么包含了大量三元组的框架知识库就成为了一个庞大的框架知识图。下面介绍汉语框架网中两种关系类型。截取表2.2的部分语料,构建汉语框架核心元素关系图(图4.1)和偏好选择关系图(图4.2)。图4.1汉语框架核心元素关系图图4.1中表示的是汉语框架网中框架与框架内的核心框架元素。本文认为,框架元素表示一段文本或者一句话中最重要的语义成分,其内容更容易与其他成分存在共指关系,特别是在段落或者篇章中,这种关系更加明显。如上所示的框架核心元素表示成三元组(春生子,状态,长白山溪流中的小鱼),(它们,死亡,NULL),(人们,命名,它们),(人们,命名,鱼食)等。图4.2选择偏好关系图
本文编号:3267502
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3267502.html