远监督关系抽取的降噪优化处理
发布时间:2021-02-04 23:19
随着互联网时代的高速发展,越来越多的问题开始出现,如何迅速、准确处理在网络上存在的海量非结构化的数据,吸引了越来越多的研究人员的关注。处理文本信息是自然语言处理的一项重要功能,而在处理文本信息中,信息抽取是极为重要的一项任务,而本文使用的关系抽取是信息抽取的一项子任务,目前存在有全监督、半监督、弱监督以及无监督关系抽取等大致几种分类,这几种分类方法的依据则是训练数据的来源。但在海量的非结构数据的问题上,都存在着准确率低或成本太高的问题。在2009年学者Mintz提出一种是在大数据环境下进行关系抽取任务的方法——远监督关系抽取,这项工作是通过将知识库中的关系实例和文本集中的句子进行对齐,在进行知识对齐的过程中是基于这样一条假设来对齐的,如果在文本集中的某条语句中,包含着知识库中的某条实体对,则认为这条句子表达了这个实体对在知识库中表达的关系标签,然后运用对齐后的数据在分类器中进行大规模训练。本文在修改训练流程的同时,对传统的训练方式进行了两点改进。一是池化过程中采用了词级别的注意力机制,解决句子中的异构语句问题;二是在数据进行初步训练后,对不完备的标签采用了基于SVD的标签补全的方法。这...
【文章来源】:吉林大学吉林省 211工程院校 985工程院校 教育部直属院校
【文章页数】:53 页
【学位级别】:硕士
【部分图文】:
神经元的基本结构
图 2.3 经典神经网络结构[26]如图2.3便是一个经典的神经网络结构,其中最左边的起始的输入信息叫做输入层,输入层的众多神经元接受大量输入信息,也称作输入向量;中间的称作隐藏层,是输入层和输出层之间的大量的神经元和连接共同组成的各个层面,如果有多个隐藏层,则表明有多个激活函数。最右边的就是输出层,可能会有很多输出神经元,信息在神经元中经过传输,运算,分析,最终形成了输出的结果,称作输出向量。对于一些全连接的神经网络结构——网络中的神经元与邻层的各个神经元都相互连接,由于输入层的输入是 word2vec,假设句子由 m 个词
卷积神经网络的层次结构
【参考文献】:
期刊论文
[1]关系抽取中基于本体的远监督样本扩充[J]. 欧阳丹彤,瞿剑峰,叶育鑫. 软件学报. 2014(09)
硕士论文
[1]基于截断核范数矩阵填充的远监督关系抽取[D]. 王烨.吉林大学 2018
[2]基于协同过滤模型与隐语义模型的推荐系统研究与实现[D]. 鲁权.湖南大学 2013
本文编号:3019098
【文章来源】:吉林大学吉林省 211工程院校 985工程院校 教育部直属院校
【文章页数】:53 页
【学位级别】:硕士
【部分图文】:
神经元的基本结构
图 2.3 经典神经网络结构[26]如图2.3便是一个经典的神经网络结构,其中最左边的起始的输入信息叫做输入层,输入层的众多神经元接受大量输入信息,也称作输入向量;中间的称作隐藏层,是输入层和输出层之间的大量的神经元和连接共同组成的各个层面,如果有多个隐藏层,则表明有多个激活函数。最右边的就是输出层,可能会有很多输出神经元,信息在神经元中经过传输,运算,分析,最终形成了输出的结果,称作输出向量。对于一些全连接的神经网络结构——网络中的神经元与邻层的各个神经元都相互连接,由于输入层的输入是 word2vec,假设句子由 m 个词
卷积神经网络的层次结构
【参考文献】:
期刊论文
[1]关系抽取中基于本体的远监督样本扩充[J]. 欧阳丹彤,瞿剑峰,叶育鑫. 软件学报. 2014(09)
硕士论文
[1]基于截断核范数矩阵填充的远监督关系抽取[D]. 王烨.吉林大学 2018
[2]基于协同过滤模型与隐语义模型的推荐系统研究与实现[D]. 鲁权.湖南大学 2013
本文编号:3019098
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3019098.html
最近更新
教材专著