基于依存句法分析的受限自然语言查询接口研究
发布时间:2021-07-03 09:21
自然语言是人类社会中最主要的信息载体,现实世界中存储和交换的大部分数据都是通过自然语言描述的,同时,它也是人与机器交互的重要媒介。数据库自然语言查询接口允许人们使用自然语言进行数据检索,不需要任何正式查询语言、数据库模型或底层数据的先验知识,因此对存储和检索信息具有重要意义。理想的自然语言接口应当支持用户针对底层数据库提出的任意查询,并以最低的代价获取准确的信息。由于受到自然语言处理技术的限制,实践上通常将查询语句的支持范围限定为一个受词汇、句式等方面约束的自然语言的子集,在该范围内实现受限的自然语言查询接口。本文的研究工作主要包括以下方面:(1)设计了一个通用数据库自然语言接口模型,在程序设计上将知识库构建与源代码相分离。根据通用接口的抽象模型,将自然语言到正式数据库语言的转换分解为自然语言到概念模型,再到结构化语言的两层映射,并以此为依据将系统划分为词法分析、句法分析和结构化语句生成三大模块。通过构建独立的专用知识库,实现系统的扩展性。(2)本文采用统计与词典相结合的N-最短路径分词方法,根据知识库优先级设定路径权重,并在分词过程中为每个词语标记关系数据的语义标签。同时,提出了一种...
【文章来源】:昆明理工大学云南省
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
NLIDB系统流程图
第二章NLIDB系统模型与知识库构建9图2.1NLIDB的抽象模型(1)语言模型向概念模型的映射:在将NLQ转换为正式的数据库查询之前,需要首先将其理解并解释为一个或多个中间结构[41],以概念模型中的元素表示查询语句的含义。(2)概念模型向数据模型的映射:将NLQ的中间结构进一步解释和转换为针对底层数据库的结构化查询语句。以映射的层级为依据,将系统模块化为三个组件:①自然语言解析;②结构化语句生成;③数据库查询。其中,①、②分别完成了自然语言到中间结构,再到结构化语言的映射。除此之外,现有NLIDB通常还包括以下一个或两个组件:(1)知识库:它存储与基础数据相关的领域知识,帮助系统更好地解析NLQ。(2)反馈生成:向用户提供关于系统对NLQ处理的反馈,或请求来自用户的附加输入以帮助系统理解NLQ。NLIDB的系统流程图可以表述为图2.2。图2.2NLIDB系统流程图
昆明理工大学专业学位硕士学位论文102.2.2NLIDB系统模型本文研究的重点是NLQ向SQL的转换过程。自然语言解析是通过对查询语句进行词法分析与句法分析,从而将自然语言映射到中间结构。结构化语句生成则负责从中间结构转换为正式的数据库查询。将交由数据库执行。根据系统流程,可以划分为词法分析、句法分析以及结构化语句生成三大模块,其内部相互独立,但模块之间相互依赖,下一模块受到上一模块输出结果的影响。知识库是整个系统的支柱,为获得正确的SQL提供保障,在系统设计上,将知识库与主程序相分离,以便于后期扩展或移植。本文的自然语言接口模型结构如图2.3所示。图2.3受限汉语自然语言接口模型结构各模块的简要分析与主要功能如下:(1)知识库知识库是计算机理解自然语言的基础,为实现接口的通用性提供了可能。本文根据知识的适用范围,将知识库划分为通用知识库和专用知识库两部分。通用知识库由分词词典、通用数据库词典与同义词词林组成,不受应用领域的影响。同义词词林是一个语义知识库,主要用于同义词识别,但是为了保证转换的准确性,本文保留了同义词词库作为补充。专用知识库将关注重点放在数据库对象上,由专用分词库、同义词词库、实体知识库、域名知识库、复合概念知识库以及枚举值知识库组成。
【参考文献】:
期刊论文
[1]《同义词词林》的嵌入表示与应用评估[J]. 段宇光,刘扬,俞士汶. 厦门大学学报(自然科学版). 2018(06)
[2]融合路径与信息内容的词语语义相似度计算[J]. 郭承湘,唐忠,石怀明. 广西大学学报(自然科学版). 2018(03)
[3]基于HMM中文词性标注研究[J]. 杨荣根,杨忠. 金陵科技学院学报. 2017(01)
[4]本体与条件随机场结合的涉农商品名称抽取与类别标注[J]. 黄念娥,黄河,王儒敬. 计算机应用. 2017(01)
[5]基于复述的中文自然语言接口[J]. 张俊驰,胡婕,刘梦赤. 计算机应用. 2016(05)
[6]中文分词与词性标注研究[J]. 梁喜涛,顾磊. 计算机技术与发展. 2015(02)
[7]面向知识库的中文自然语言问句的语义理解[J]. 许坤,冯岩松,赵东岩,陈立伟,邹磊. 北京大学学报(自然科学版). 2014(01)
[8]基于实体的数据库汉语问句查询接口研究[J]. 朱文海,黄小斌. 现代计算机. 2013(10)
[9]自然语言向SQL代码的转化方法[J]. 杨鹤标,陈力. 计算机工程. 2011(23)
[10]基于Ontology的数据库自然语言查询接口的研究[J]. 李虎,田金文,王缓缓,石勇. 计算机科学. 2010(06)
博士论文
[1]关于计算机理解自然查询语言的研究[D]. 郑逢斌.西南交通大学 2004
[2]中文数据库自然语言查询处理研究[D]. 孟小峰.中国科学院研究生院(计算技术研究所) 1999
硕士论文
[1]基于条件随机场的中文分词技术的研究与实现[D]. 徐晓芳.南京邮电大学 2018
[2]基于语义依存文法分析模型的受限自然语言查询接口研究[D]. 宋甜.武汉大学 2017
[3]面向受限自然语言的语法分析研究[D]. 张胜歧.重庆大学 2010
[4]汉语自动分词和中文人名识别技术研究[D]. 熊冬明.浙江大学 2006
[5]通用数据库自然语言接口的设计方法[D]. 龚珂琳.国防科学技术大学 2005
本文编号:3262305
【文章来源】:昆明理工大学云南省
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
NLIDB系统流程图
第二章NLIDB系统模型与知识库构建9图2.1NLIDB的抽象模型(1)语言模型向概念模型的映射:在将NLQ转换为正式的数据库查询之前,需要首先将其理解并解释为一个或多个中间结构[41],以概念模型中的元素表示查询语句的含义。(2)概念模型向数据模型的映射:将NLQ的中间结构进一步解释和转换为针对底层数据库的结构化查询语句。以映射的层级为依据,将系统模块化为三个组件:①自然语言解析;②结构化语句生成;③数据库查询。其中,①、②分别完成了自然语言到中间结构,再到结构化语言的映射。除此之外,现有NLIDB通常还包括以下一个或两个组件:(1)知识库:它存储与基础数据相关的领域知识,帮助系统更好地解析NLQ。(2)反馈生成:向用户提供关于系统对NLQ处理的反馈,或请求来自用户的附加输入以帮助系统理解NLQ。NLIDB的系统流程图可以表述为图2.2。图2.2NLIDB系统流程图
昆明理工大学专业学位硕士学位论文102.2.2NLIDB系统模型本文研究的重点是NLQ向SQL的转换过程。自然语言解析是通过对查询语句进行词法分析与句法分析,从而将自然语言映射到中间结构。结构化语句生成则负责从中间结构转换为正式的数据库查询。将交由数据库执行。根据系统流程,可以划分为词法分析、句法分析以及结构化语句生成三大模块,其内部相互独立,但模块之间相互依赖,下一模块受到上一模块输出结果的影响。知识库是整个系统的支柱,为获得正确的SQL提供保障,在系统设计上,将知识库与主程序相分离,以便于后期扩展或移植。本文的自然语言接口模型结构如图2.3所示。图2.3受限汉语自然语言接口模型结构各模块的简要分析与主要功能如下:(1)知识库知识库是计算机理解自然语言的基础,为实现接口的通用性提供了可能。本文根据知识的适用范围,将知识库划分为通用知识库和专用知识库两部分。通用知识库由分词词典、通用数据库词典与同义词词林组成,不受应用领域的影响。同义词词林是一个语义知识库,主要用于同义词识别,但是为了保证转换的准确性,本文保留了同义词词库作为补充。专用知识库将关注重点放在数据库对象上,由专用分词库、同义词词库、实体知识库、域名知识库、复合概念知识库以及枚举值知识库组成。
【参考文献】:
期刊论文
[1]《同义词词林》的嵌入表示与应用评估[J]. 段宇光,刘扬,俞士汶. 厦门大学学报(自然科学版). 2018(06)
[2]融合路径与信息内容的词语语义相似度计算[J]. 郭承湘,唐忠,石怀明. 广西大学学报(自然科学版). 2018(03)
[3]基于HMM中文词性标注研究[J]. 杨荣根,杨忠. 金陵科技学院学报. 2017(01)
[4]本体与条件随机场结合的涉农商品名称抽取与类别标注[J]. 黄念娥,黄河,王儒敬. 计算机应用. 2017(01)
[5]基于复述的中文自然语言接口[J]. 张俊驰,胡婕,刘梦赤. 计算机应用. 2016(05)
[6]中文分词与词性标注研究[J]. 梁喜涛,顾磊. 计算机技术与发展. 2015(02)
[7]面向知识库的中文自然语言问句的语义理解[J]. 许坤,冯岩松,赵东岩,陈立伟,邹磊. 北京大学学报(自然科学版). 2014(01)
[8]基于实体的数据库汉语问句查询接口研究[J]. 朱文海,黄小斌. 现代计算机. 2013(10)
[9]自然语言向SQL代码的转化方法[J]. 杨鹤标,陈力. 计算机工程. 2011(23)
[10]基于Ontology的数据库自然语言查询接口的研究[J]. 李虎,田金文,王缓缓,石勇. 计算机科学. 2010(06)
博士论文
[1]关于计算机理解自然查询语言的研究[D]. 郑逢斌.西南交通大学 2004
[2]中文数据库自然语言查询处理研究[D]. 孟小峰.中国科学院研究生院(计算技术研究所) 1999
硕士论文
[1]基于条件随机场的中文分词技术的研究与实现[D]. 徐晓芳.南京邮电大学 2018
[2]基于语义依存文法分析模型的受限自然语言查询接口研究[D]. 宋甜.武汉大学 2017
[3]面向受限自然语言的语法分析研究[D]. 张胜歧.重庆大学 2010
[4]汉语自动分词和中文人名识别技术研究[D]. 熊冬明.浙江大学 2006
[5]通用数据库自然语言接口的设计方法[D]. 龚珂琳.国防科学技术大学 2005
本文编号:3262305
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3262305.html
最近更新
教材专著