基于词分布和深度残差网络的关系抽取方法研究
发布时间:2021-06-25 02:02
随着大数据时代的到来,海量的信息以半结构或者原始文本的形式存在于网络中,如何将其中的信息以结构化的形式储存是当前亟待解决的问题。知识图谱作为结构化的语义网络被广泛用于自然语言处理中,关系抽取可用于文本中实体对之间语义关系的识别,在文本的语义理解和知识图谱的构建及完善中发挥着重要作用。基于神经网络的关系抽取方法是当前关系抽取的主流方法之一,它可降低传统自然语言处理中特征工程的复杂性,减少错误传播,在实际应用中取得了较强的效果与泛化性。结合词分布的向量表示和深度残差网络,本文开展了关系抽取方法的研究工作,本文的主要工作如下:1.提出了一种融合词语义信息与词位置信息的词分布模型。首先,结合二维高斯分布拟合单词的位置集合,用于文本的相似度计算,在此基础上,给出了融合词语义信息与词位置信息的词分布模型;其次,通过计算各个类簇间的高频词与类簇间的相似度,提出了句子级的词分布向量表示方法;最后,通过计算单词与各个类簇间的相似度,并结合关系文本聚类,提出了单词级的词分布向量表示方法。实验结果表明:在远程监督数据Wiki和NYT上,本文提出的结合词分布模型的单词级向量方法比文献中的方法具有更好的效果。2...
【文章来源】:重庆邮电大学重庆市
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
关系抽取示意图
重庆邮电大学硕士学位论文第2章相关技术介绍10图2.1CBOW模型图2.2Skip-Gram模型2.2关系文本聚类在文本信息结构化的研究中,首先面对的任务就是对文本信息的梳理,从原本杂乱无章的文本中获取相对条理化的信息文本。如何快速、准确、全面获取信息以及快速高效地进行信息的梳理,进而找到用户所需,是当前的急切需要。聚类技术是完成文本信息结构化这一过程的重要技术之一。聚类的概念是在无监督的情况下,将物理或抽象样本的集合划分为相似样本的过程。一般来讲,同一类别内的样本会具有较高的相似度,而不同类别中的样本则相似度较低。文本聚类是将聚类技术用于自然语言处理领域的研究方法,其具体的方法是在缺少类别标签的定义和标注文本的情况下,通过无监督学习的方法,自动产生文本的类别标签,并将文本划分到相应类别的过程。文本聚类技术是文本信息处理研究
重庆邮电大学硕士学位论文第2章相关技术介绍10图2.1CBOW模型图2.2Skip-Gram模型2.2关系文本聚类在文本信息结构化的研究中,首先面对的任务就是对文本信息的梳理,从原本杂乱无章的文本中获取相对条理化的信息文本。如何快速、准确、全面获取信息以及快速高效地进行信息的梳理,进而找到用户所需,是当前的急切需要。聚类技术是完成文本信息结构化这一过程的重要技术之一。聚类的概念是在无监督的情况下,将物理或抽象样本的集合划分为相似样本的过程。一般来讲,同一类别内的样本会具有较高的相似度,而不同类别中的样本则相似度较低。文本聚类是将聚类技术用于自然语言处理领域的研究方法,其具体的方法是在缺少类别标签的定义和标注文本的情况下,通过无监督学习的方法,自动产生文本的类别标签,并将文本划分到相应类别的过程。文本聚类技术是文本信息处理研究
【参考文献】:
期刊论文
[1]基于Deep Belief Nets的中文名实体关系抽取[J]. 陈宇,郑德权,赵铁军. 软件学报. 2012(10)
[2]实体关系抽取的技术方法综述[J]. 徐健,张智雄,吴振新. 现代图书情报技术. 2008(08)
[3]中文事件抽取技术研究[J]. 赵妍妍,秦兵,车万翔,刘挺. 中文信息学报. 2008(01)
[4]自然语言处理及其应用前景的研究[J]. 王挺,麦范金,刘忠. 桂林航天工业高等专科学校学报. 2006(04)
[5]实体关系自动抽取[J]. 车万翔,刘挺,李生. 中文信息学报. 2005(02)
[6]基于聚类的文本过滤模型[J]. 林鸿飞,马雅彬. 大连理工大学学报. 2002(02)
博士论文
[1]绿色通信网络的节能方法研究[D]. 郭秉义.华南理工大学 2014
硕士论文
[1]下一代接入网节能技术研究[D]. 郭晓达.北京邮电大学 2013
本文编号:3248269
【文章来源】:重庆邮电大学重庆市
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
关系抽取示意图
重庆邮电大学硕士学位论文第2章相关技术介绍10图2.1CBOW模型图2.2Skip-Gram模型2.2关系文本聚类在文本信息结构化的研究中,首先面对的任务就是对文本信息的梳理,从原本杂乱无章的文本中获取相对条理化的信息文本。如何快速、准确、全面获取信息以及快速高效地进行信息的梳理,进而找到用户所需,是当前的急切需要。聚类技术是完成文本信息结构化这一过程的重要技术之一。聚类的概念是在无监督的情况下,将物理或抽象样本的集合划分为相似样本的过程。一般来讲,同一类别内的样本会具有较高的相似度,而不同类别中的样本则相似度较低。文本聚类是将聚类技术用于自然语言处理领域的研究方法,其具体的方法是在缺少类别标签的定义和标注文本的情况下,通过无监督学习的方法,自动产生文本的类别标签,并将文本划分到相应类别的过程。文本聚类技术是文本信息处理研究
重庆邮电大学硕士学位论文第2章相关技术介绍10图2.1CBOW模型图2.2Skip-Gram模型2.2关系文本聚类在文本信息结构化的研究中,首先面对的任务就是对文本信息的梳理,从原本杂乱无章的文本中获取相对条理化的信息文本。如何快速、准确、全面获取信息以及快速高效地进行信息的梳理,进而找到用户所需,是当前的急切需要。聚类技术是完成文本信息结构化这一过程的重要技术之一。聚类的概念是在无监督的情况下,将物理或抽象样本的集合划分为相似样本的过程。一般来讲,同一类别内的样本会具有较高的相似度,而不同类别中的样本则相似度较低。文本聚类是将聚类技术用于自然语言处理领域的研究方法,其具体的方法是在缺少类别标签的定义和标注文本的情况下,通过无监督学习的方法,自动产生文本的类别标签,并将文本划分到相应类别的过程。文本聚类技术是文本信息处理研究
【参考文献】:
期刊论文
[1]基于Deep Belief Nets的中文名实体关系抽取[J]. 陈宇,郑德权,赵铁军. 软件学报. 2012(10)
[2]实体关系抽取的技术方法综述[J]. 徐健,张智雄,吴振新. 现代图书情报技术. 2008(08)
[3]中文事件抽取技术研究[J]. 赵妍妍,秦兵,车万翔,刘挺. 中文信息学报. 2008(01)
[4]自然语言处理及其应用前景的研究[J]. 王挺,麦范金,刘忠. 桂林航天工业高等专科学校学报. 2006(04)
[5]实体关系自动抽取[J]. 车万翔,刘挺,李生. 中文信息学报. 2005(02)
[6]基于聚类的文本过滤模型[J]. 林鸿飞,马雅彬. 大连理工大学学报. 2002(02)
博士论文
[1]绿色通信网络的节能方法研究[D]. 郭秉义.华南理工大学 2014
硕士论文
[1]下一代接入网节能技术研究[D]. 郭晓达.北京邮电大学 2013
本文编号:3248269
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3248269.html
最近更新
教材专著