基于知识图谱的问答系统问句理解方法研究
发布时间:2021-08-19 23:26
从互联网的海量数据中获取信息已经成为人们的基本需要。由于搜索引擎不能直接得到所需的答案,因此本文对基于知识图谱的问答系统进行研究,旨在提出可以理解用户以自然语言提出的问句,并返回一个简洁答案的模型。在知识图谱中,知识以三元组<实体,关系,实体>的方式进行存储,因此基于知识图谱的问答系统主要解决由三元组构成的事实类问题。在问答系统中,准确理解用户问句,需要理解多样化的自然语言表述,这是本文的研究重点。根据问句信息的不同层次,本文将对问句的理解分为宏观和微观两个部分。宏观理解从句子层面进行,微观理解则从实体层面和关系层面来开展。具体工作主要有:1.本文提出一个基于胶囊网络的问句分类模型(Cap-net)。该模型能够结合双向LSTM和注意力机制,再加上胶囊网络,提取问句更多的特征。然后根据需要,将问句按照用户意图或者答案类型进行分类。2.本文提出一个基于语义相似性的实体链接和关系检测模型。该模型使用卷积神经网络,对问句和知识图谱中的实体与关系进行向量化表示。在实体链接任务中,本文提出,将问句中识别出来的实体表述,通过实体-表述映射表,得到候选实体。然后通过本文提出基于语义相似性的...
【文章来源】:西华大学四川省
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
CBOW模型
图 2.2 知识图谱示例Fig. 2.2 Knowledge Graph example图 2.2 所示,当用户在知识图谱中查找实体“西华大学”,可以得到它的所在办时间、简称和类别等信息。得到所在城市“成都”,可以在网络中继续查找关信息。这极大加快了检索信息的速度。。15 年,杜亚军等人对微博知识图谱构建方法进行了研究[46],将其分为实体提取、知识图谱建立几部分。从现实世界非结构化数据中,提取出了实体和关系将其组合为知识三元组。本文的研究实质上是在已有知识三元组的基础上,将到对应知识图谱实体和关系上,得到能回答问句的三元组,也就得到了答案。义相似性模型文利用语义相似性模型来完成实体链接及关系检测任务。计算文本相似度主要语法和句法结构、基于语料库的方法。于语法和句法结构的文本语义相似性模型,通过对文本的语法分析,将其语法度与词组语义相似度相结合,能够计算不同词组顺序对文本的影响,更好地计
基于知识图谱的问句理解方法研究3.2 问句分类模型结构深度学习的神经网络模型是使用不带有方向的标量来表示句子,虽然近年来基于深度学习的方法在问句分类上有了许多成果。但是由于语言表达的复杂性,使用标量来表达问句具有一定的局限性。针对这一问题,结合问句分类的特点,本文提出了一种基于胶囊网络(Capsule network)的问句分类模型(Cap-net)。胶囊网络[50]能够将标量转化为带有位置信息的矢量,更好地表示问句中的语义等信息。本文采用自然语言处理中常用的双向 LSTM(Bi-LSTM),将问句转化成标量,再传入胶囊网络中转化成矢量,进行本文的问句分类研究。同时,由于问句中不同词对于分类任务贡献不同,这里引入词级别的注意力机制,使分类模型能够更关注对分类任务贡献大的词。
【参考文献】:
期刊论文
[1]一种基于特征加权的文本相似度计算算法[J]. 邱先标,陈笑蓉. 贵州大学学报(自然科学版). 2018(01)
[2]基于中文知识图谱的电商领域问答系统[J]. 杜泽宇,杨燕,贺樑. 计算机应用与软件. 2017(05)
[3]CLEQS——基于知识图谱构建的跨语言实体查询系统[J]. 苏永浩,张驰,程文亮,钱卫宁. 计算机应用. 2016(S1)
[4]中文短文本语法语义相似度算法[J]. 廖志芳,周国恩,李俊锋,刘飞,蔡飞. 湖南大学学报(自然科学版). 2016(02)
[5]融合知识图谱的查询扩展模型及其稳定性研究[J]. 郝林雪,张鹏,宋大为,候越先. 计算机科学与探索. 2017(01)
[6]一种面向多源知识图谱的样例查询方法[J]. 汤楠,申德荣,寇月,聂铁铮. 计算机研究与发展. 2015(S1)
[7]基于本体的航空领域问答系统[J]. 张克亮,李伟刚,王慧兰. 中文信息学报. 2015(04)
[8]微博知识图谱构建方法研究[J]. 杜亚军,吴越. 西华大学学报(自然科学版). 2015(01)
[9]实体链指技术研究进展[J]. 郭宇航,秦兵,刘挺,李生. 智能计算机与应用. 2014(05)
[10]基于主动学习的中文问题分类数据集构建[J]. 邱锡鹏,缪有栋,黄萱菁. 哈尔滨工业大学学报. 2012(05)
硕士论文
[1]基于深度学习的中文实体关系抽取方法研究[D]. 唐敏.西南交通大学 2018
[2]基于信息抽取的英文问句意图分类[D]. 钟世敏.西华大学 2018
[3]基于序列短文本的事件分类和话题追踪[D]. 贺立言.西华大学 2018
[4]Web信息抽取中的若干关键问题研究[D]. 于永波.中国科学技术大学 2015
[5]基于潜在语义分析的学科知识图谱构建[D]. 孙小欣.华中师范大学 2013
本文编号:3352338
【文章来源】:西华大学四川省
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
CBOW模型
图 2.2 知识图谱示例Fig. 2.2 Knowledge Graph example图 2.2 所示,当用户在知识图谱中查找实体“西华大学”,可以得到它的所在办时间、简称和类别等信息。得到所在城市“成都”,可以在网络中继续查找关信息。这极大加快了检索信息的速度。。15 年,杜亚军等人对微博知识图谱构建方法进行了研究[46],将其分为实体提取、知识图谱建立几部分。从现实世界非结构化数据中,提取出了实体和关系将其组合为知识三元组。本文的研究实质上是在已有知识三元组的基础上,将到对应知识图谱实体和关系上,得到能回答问句的三元组,也就得到了答案。义相似性模型文利用语义相似性模型来完成实体链接及关系检测任务。计算文本相似度主要语法和句法结构、基于语料库的方法。于语法和句法结构的文本语义相似性模型,通过对文本的语法分析,将其语法度与词组语义相似度相结合,能够计算不同词组顺序对文本的影响,更好地计
基于知识图谱的问句理解方法研究3.2 问句分类模型结构深度学习的神经网络模型是使用不带有方向的标量来表示句子,虽然近年来基于深度学习的方法在问句分类上有了许多成果。但是由于语言表达的复杂性,使用标量来表达问句具有一定的局限性。针对这一问题,结合问句分类的特点,本文提出了一种基于胶囊网络(Capsule network)的问句分类模型(Cap-net)。胶囊网络[50]能够将标量转化为带有位置信息的矢量,更好地表示问句中的语义等信息。本文采用自然语言处理中常用的双向 LSTM(Bi-LSTM),将问句转化成标量,再传入胶囊网络中转化成矢量,进行本文的问句分类研究。同时,由于问句中不同词对于分类任务贡献不同,这里引入词级别的注意力机制,使分类模型能够更关注对分类任务贡献大的词。
【参考文献】:
期刊论文
[1]一种基于特征加权的文本相似度计算算法[J]. 邱先标,陈笑蓉. 贵州大学学报(自然科学版). 2018(01)
[2]基于中文知识图谱的电商领域问答系统[J]. 杜泽宇,杨燕,贺樑. 计算机应用与软件. 2017(05)
[3]CLEQS——基于知识图谱构建的跨语言实体查询系统[J]. 苏永浩,张驰,程文亮,钱卫宁. 计算机应用. 2016(S1)
[4]中文短文本语法语义相似度算法[J]. 廖志芳,周国恩,李俊锋,刘飞,蔡飞. 湖南大学学报(自然科学版). 2016(02)
[5]融合知识图谱的查询扩展模型及其稳定性研究[J]. 郝林雪,张鹏,宋大为,候越先. 计算机科学与探索. 2017(01)
[6]一种面向多源知识图谱的样例查询方法[J]. 汤楠,申德荣,寇月,聂铁铮. 计算机研究与发展. 2015(S1)
[7]基于本体的航空领域问答系统[J]. 张克亮,李伟刚,王慧兰. 中文信息学报. 2015(04)
[8]微博知识图谱构建方法研究[J]. 杜亚军,吴越. 西华大学学报(自然科学版). 2015(01)
[9]实体链指技术研究进展[J]. 郭宇航,秦兵,刘挺,李生. 智能计算机与应用. 2014(05)
[10]基于主动学习的中文问题分类数据集构建[J]. 邱锡鹏,缪有栋,黄萱菁. 哈尔滨工业大学学报. 2012(05)
硕士论文
[1]基于深度学习的中文实体关系抽取方法研究[D]. 唐敏.西南交通大学 2018
[2]基于信息抽取的英文问句意图分类[D]. 钟世敏.西华大学 2018
[3]基于序列短文本的事件分类和话题追踪[D]. 贺立言.西华大学 2018
[4]Web信息抽取中的若干关键问题研究[D]. 于永波.中国科学技术大学 2015
[5]基于潜在语义分析的学科知识图谱构建[D]. 孙小欣.华中师范大学 2013
本文编号:3352338
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3352338.html
最近更新
教材专著