基于道路法规知识图谱的多轮自动问答研究
发布时间:2020-12-23 04:32
[目的/意义]传统的基于知识图谱的自动问答研究主要是针对用户提问直接检索答案,但由于系统对用户问题的理解存在歧义,导致得到的答案不够精确。采用基于知识图谱的多轮自动问答可以有效地改善这一问题。[方法/过程]本文首先构建了以事件为中心的道路法规本体模型,依据该模型从道路法规中抽取实例图谱,并设计出基于道路法规知识图谱的问答框架。然后,对该框架所使用到的模型进行测评。最后,进行系统的总体测评。[结果/结论]从模块测评结果来看,本文所提出BCNN_BiLSM模型在事件识别和意图识别的F1值分别是0.798和0.930,BBi LSTM_CRF模型在本体属性识别F1值为0.807,总体性能优于其他模型。系统的总体测评结果表明,完整句的准确率为0.74,缺省句的任务完成率为0.83。本文提出的基于道路法规知识图谱的多轮自动问答可为相关领域自动问答研究提供参考。
【文章来源】:现代情报. 2020年08期 CSSCI
【文章页数】:14 页
【部分图文】:
道路法规本体
根据上述构建的道路法规本体,本文以《中华人民共和国道路交通安全法》为例,选取第九十一条规定的部分内容进行语义描述,该内容片段为“饮酒后驾驶机动车的,处暂扣六个月机动车驾驶证,并处一千元以上二千元以下罚款。因饮酒后驾驶机动车被处罚,再次饮酒后驾驶机动车的,处十日以下拘留,并处一千元以上二千元以下罚款,吊销机动车驾驶证。”[23]。该规定主要涉及2个“酒驾”事件,事件涉及的物体主要有“驾驶证”,酒驾事件导致的行政处罚结果有“暂扣机动车驾驶证”“吊销机动车驾驶证”“拘留”和“罚款”,其中暂扣机动车驾驶证时间为6个月,拘留天数为10天以下,罚款数额均为1 000元以上2 000元以下。该法规的语义描述结果如图2所示。基于上述设计的本体,以HTML格式的道路交通法规相关文本作为数据源,构建道路法规知识图谱。本研究将知识提取的任务划分为实体提取、关系提取、属性和属性值提取,并将抽取到的知识用三元组的形式表示:1)实体—关系—实体(Ehead,R,Etail),R是实体Ehead和实体Etail之间的关系,如:驾驶人—驾驶—机动车;2)实体—属性—属性值(Entity-Attribute-Value),属性是描述实体的数据,如“机动车—定义—以动力装置驱动或者牵引,上道路行驶的供人员乘用或者用于运送物品以及进行工程专项作业的轮式车辆”,属性值有数据类型的约束,常用的数据类型有:文本型、数字型、逻辑型、枚举型等。
道路法规知识图谱实现了道路法规各类知识的关联和整合,以专业化、结构化的方式对知识进行语义表示,是一种高效管理和利用知识的方式。在此基础上,基于构建的知识图谱提出了一种面向知识库的多轮自动问答方法。与常见的聊天机器人(如图灵、微软小冰)不同,聊天机器人主要是无特定目的的对话,本文所构建的问答系统更偏向于目标驱动的特定信息获取,它是一种具有极强的针对性和准确性的问答系统。问答系统的准确性一方面取决于知识库中所蕴含的知识的深度和广度;另一方面取决于系统对用户自然语言理解提问的理解程度。因此,多轮问答通过系统向用户进行多次追问的方式填充用户初始提问中缺失的语义信息,从而帮助系统更好地理解用户的查询意图,提高问答系统的准确率。本研究构建的基于知识图谱的多轮自动问答系统框架如图3所示,该系统框架主要包含3个部分:问题理解(Question Understanding,QU)、知识图谱查询(Knowledge Graph Matcher,KGM)和问答生成(Asking&Answering Generator,AAG)。问题理解模块的功能是对用户输入的自然语言提问进行分词、词性标注等预处理,对其中涉及的交通事件、意图、属性和属性值进行识别,将用户输入的自然语言提问转化成结构化的语义表示。知识图谱查询模块的功能是将问题的语义转换成结构化的查询,从道路法规知识图谱中查询匹配的相关信息。查询到的结果可能是直接的答案或缺失的信息,如果是答案则可以直接返回,如果是缺失的信息,问答系统会生成一个追问。3.1 问题理解
【参考文献】:
硕士论文
[1]基于语义内容的交通监控视频检索研究[D]. 刘吉双.重庆大学 2018
[2]面向自动问答的游客问题语义模型研究[D]. 陈文聪.电子科技大学 2018
[3]住房公积金领域自动问答系统关键技术研究[D]. 陶杰.哈尔滨工程大学 2018
[4]基于本体的中医冠心病自动问答系统的设计与实现[D]. 温思琦.沈阳工业大学 2017
[5]基于领域本体的客服问答系统的设计与实现[D]. 刘晓强.青岛大学 2016
[6]基于中草药语义网的自动问答系统的研究与实现[D]. 钱宏泽.浙江大学 2016
[7]基于本体和描述逻辑的交通事件语义表现方法研究[D]. 于云.山东理工大学 2015
[8]基于领域本体中文自动问答系统相关技术的研究与实现[D]. 郭磊.华东理工大学 2013
本文编号:2933077
【文章来源】:现代情报. 2020年08期 CSSCI
【文章页数】:14 页
【部分图文】:
道路法规本体
根据上述构建的道路法规本体,本文以《中华人民共和国道路交通安全法》为例,选取第九十一条规定的部分内容进行语义描述,该内容片段为“饮酒后驾驶机动车的,处暂扣六个月机动车驾驶证,并处一千元以上二千元以下罚款。因饮酒后驾驶机动车被处罚,再次饮酒后驾驶机动车的,处十日以下拘留,并处一千元以上二千元以下罚款,吊销机动车驾驶证。”[23]。该规定主要涉及2个“酒驾”事件,事件涉及的物体主要有“驾驶证”,酒驾事件导致的行政处罚结果有“暂扣机动车驾驶证”“吊销机动车驾驶证”“拘留”和“罚款”,其中暂扣机动车驾驶证时间为6个月,拘留天数为10天以下,罚款数额均为1 000元以上2 000元以下。该法规的语义描述结果如图2所示。基于上述设计的本体,以HTML格式的道路交通法规相关文本作为数据源,构建道路法规知识图谱。本研究将知识提取的任务划分为实体提取、关系提取、属性和属性值提取,并将抽取到的知识用三元组的形式表示:1)实体—关系—实体(Ehead,R,Etail),R是实体Ehead和实体Etail之间的关系,如:驾驶人—驾驶—机动车;2)实体—属性—属性值(Entity-Attribute-Value),属性是描述实体的数据,如“机动车—定义—以动力装置驱动或者牵引,上道路行驶的供人员乘用或者用于运送物品以及进行工程专项作业的轮式车辆”,属性值有数据类型的约束,常用的数据类型有:文本型、数字型、逻辑型、枚举型等。
道路法规知识图谱实现了道路法规各类知识的关联和整合,以专业化、结构化的方式对知识进行语义表示,是一种高效管理和利用知识的方式。在此基础上,基于构建的知识图谱提出了一种面向知识库的多轮自动问答方法。与常见的聊天机器人(如图灵、微软小冰)不同,聊天机器人主要是无特定目的的对话,本文所构建的问答系统更偏向于目标驱动的特定信息获取,它是一种具有极强的针对性和准确性的问答系统。问答系统的准确性一方面取决于知识库中所蕴含的知识的深度和广度;另一方面取决于系统对用户自然语言理解提问的理解程度。因此,多轮问答通过系统向用户进行多次追问的方式填充用户初始提问中缺失的语义信息,从而帮助系统更好地理解用户的查询意图,提高问答系统的准确率。本研究构建的基于知识图谱的多轮自动问答系统框架如图3所示,该系统框架主要包含3个部分:问题理解(Question Understanding,QU)、知识图谱查询(Knowledge Graph Matcher,KGM)和问答生成(Asking&Answering Generator,AAG)。问题理解模块的功能是对用户输入的自然语言提问进行分词、词性标注等预处理,对其中涉及的交通事件、意图、属性和属性值进行识别,将用户输入的自然语言提问转化成结构化的语义表示。知识图谱查询模块的功能是将问题的语义转换成结构化的查询,从道路法规知识图谱中查询匹配的相关信息。查询到的结果可能是直接的答案或缺失的信息,如果是答案则可以直接返回,如果是缺失的信息,问答系统会生成一个追问。3.1 问题理解
【参考文献】:
硕士论文
[1]基于语义内容的交通监控视频检索研究[D]. 刘吉双.重庆大学 2018
[2]面向自动问答的游客问题语义模型研究[D]. 陈文聪.电子科技大学 2018
[3]住房公积金领域自动问答系统关键技术研究[D]. 陶杰.哈尔滨工程大学 2018
[4]基于本体的中医冠心病自动问答系统的设计与实现[D]. 温思琦.沈阳工业大学 2017
[5]基于领域本体的客服问答系统的设计与实现[D]. 刘晓强.青岛大学 2016
[6]基于中草药语义网的自动问答系统的研究与实现[D]. 钱宏泽.浙江大学 2016
[7]基于本体和描述逻辑的交通事件语义表现方法研究[D]. 于云.山东理工大学 2015
[8]基于领域本体中文自动问答系统相关技术的研究与实现[D]. 郭磊.华东理工大学 2013
本文编号:2933077
本文链接:https://www.wllwen.com/kejilunwen/jiaotonggongchenglunwen/2933077.html