基于知识图谱的山西旅游饮食问答系统

发布时间:2021-01-01 14:17
  随着互联网的飞速发展,“信息化”体现在人们日常生活中的各方各面。大数据时代下,人们的生活已经离不开互联网的支持,“互联网+”的发展模式已经成为一种趋势。“互联网+旅游”也成为了我国各大景区最常见的经营发展模式。随着旅行人数逐年增多,传统的旅游模式下,游客想要及时的获取景区信息已经是难上加难,迫切需要一种新的方式来满足游客的需求。在此背景下,结合自然语言处理的应用和发展,一种面向用户的智能问答系统应用而生。与传统搜索引擎的检索方式相比,智能问答系统更加简练、直接,可以更加快速地根据用户的问题反馈出一个用户需要的答案,这在一定程度上大大的提高了检索的效率,用户也可以更好的了解景区的信息,给用户带来更好的旅行体验。本文针对旅游领域,以山西为例,给出了一种深度学习中基于BiLSTM-CNN-CRF模型的智能问答系统。本文的主要工作如下:(1)运用Python中的Scrapy爬虫框架,从携程网、途牛网、去哪儿网三大旅游网站爬取山西旅游数据,并整合所有数据,导入Neo4j中,构建出山西旅游隐身知识图谱。(2)在大部分基于知识图谱的BiLSTM-CRF问答模型的基础上,加入一层CNN,提出BiLST... 

【文章来源】:中北大学山西省

【文章页数】:77 页

【学位级别】:硕士

【部分图文】:

基于知识图谱的山西旅游饮食问答系统


语义解析树形式图

图形,语义,逻辑形式


中北大学学位论文6常用数据集:WebQuestion、SimpleQuestion、NLPCCKBQA数据集(中文)下面根据常见分类分别进行详细展开:(1)基于符号表示的KB-QA(传统的语义解析方法)定义:该方法的主旨:首先将自然语言转化成逻辑形式,接着对逻辑形式进行从下到上的解析,从而得出一种可以表达整个问题语义的逻辑形式,最后在知识库中通过对应的查询语言得出需要的答案。语义解析传统方法:问题->短语检测->资源映射->语义组合->逻辑表达式,具体如图2.1所示图2.1语义解析树形式图Figure2.1.Semanticparsetreeformdiagram语义解析目前一般做法:建图->主题词链接->确定核心推导链->增加约束和聚合函数。如图2.2所示图2.2查询图形式Figure2.2querygraphform(1)将语义解析简化为查询图生成,将其表述为具有分阶段状态和动作的搜索问题。(2)基于向量表示的KB-QA(基于表示学习的方法)定义:把知识库问答看做一个语义匹配过程。通过表示学习知识库以及用户问题的语

结构图,问答系统,结构图,问句


中北大学学位论文92.1.3基于问答对的问答系统随着互联网技术不断成熟和飞速发展,网络上兴起了了一种常问问题(frequentaskedquestions,FAQ[10])数据,尤其是2005年末以来,大量的社区问答(communitybasedquestionanswering,CQA[11])数据开始活跃在网络上,随着大量的问答案对数据的涌现,问答系统的研究开始正式进入了开放领域、基于问题答对的问答系统时期。其系统结构图如2.3所示图2.3基于问答对的问答系统结构图Figure2.3Structurediagramofquestionandanswersystembasedonquestionandanswerpairs通常情况下,构建基于结构化数据的问答系统的方式有以下两种:第一种方法是如图2.4所示的传统方法,就是将用户的问句转化为SPARQL查询语言到结构化数据库中寻找答案,这种方法操作和原理相对简单,但是缺乏对用户的问句进行语义分析,因为只是单单将问句转化为数据库查询语言,这样反馈给用户的结果往往都缺乏准确率[12];第二种方法则是如图2.5所示现在被广泛研究和应用的基于深度学习的问答系统的构建方法。采用深度学习来构建问答系统,用户提出的问句分词先用word2vec转化为向量的形式[13]。通过BiLSTM,CNN等神经网络模型处理用户的问句分词向量,分析语义特征之后获取问句实体,最后通过计算低维度空间向量中问句实体和候选答案的余弦相似性,从而得出问句的正确答案[13][14]。图2.4传统方法下基于结构化数据的问答系统结构图Figure2.4Structurediagramofquestionansweringsystembasedonstructureddataundertraditional

【参考文献】:
期刊论文
[1]卷积神经网络过拟合问题研究[J]. 任义丽,罗路.  信息系统工程. 2019(05)
[2]基于卷积神经网络的图像分类算法综述[J]. 杨真真,匡楠,范露,康彬.  信号处理. 2018(12)
[3]Expressivity issues in SPARQL: monotonicity and two-versus three-valued semantics[J]. Xiaowang ZHANG,Chenhong MENG,Lei ZOU.  Science China(Information Sciences). 2018(12)
[4]基于BiGRU-attention神经网络的文本情感分类模型[J]. 王伟,孙玉霞,齐庆杰,孟祥福.  计算机应用研究. 2019(12)
[5]A language-independent neural network for event detection[J]. Xiaocheng FENG,Bing QIN,Ting LIU.  Science China(Information Sciences). 2018(09)
[6]基于Gate机制与Bi-LSTM-CRF的汉语语义角色标注[J]. 张苗苗,张玉洁,刘明童,徐金安,陈钰枫.  计算机与现代化. 2018(04)
[7]基于深度学习的推荐系统研究综述[J]. 黄立威,江碧涛,吕守业,刘艳博,李德毅.  计算机学报. 2018(07)
[8]旅游推荐系统研究综述[J]. 常亮,曹玉婷,孙文平,张伟涛,陈君同.  计算机科学. 2017(10)
[9]基于卷积神经网络的公安案件文本语义特征提取方法研究[J]. 林志宏,池宏,许保光.  数学的实践与认识. 2017(17)
[10]数字多媒体旅游咨询信息智能问答系统设计[J]. 李佳,杨婷婷,刘伟.  现代电子技术. 2017(12)

博士论文
[1]基于深度神经网络的文本表示及其应用[D]. 户保田.哈尔滨工业大学 2016

硕士论文
[1]基于知识图谱的旅游问答系统研究与实现[D]. 张楚婷.桂林电子科技大学 2019
[2]面向消化内科辅助诊疗的生成式对话系统研究[D]. 程梦卓.中国科学技术大学 2019
[3]基于深度神经网络的中文命名实体识别研究[D]. 顾孙炎.南京邮电大学 2018
[4]基于全变分的并行磁共振图像重建的快速算法研究[D]. 晏士友.南京邮电大学 2018
[5]基于中文知识图谱的智能问答系统设计与实现[D]. 张淼.华中师范大学 2018
[6]基于Scrapy框架的网络爬虫实现与数据抓取分析[D]. 安子建.吉林大学 2017
[7]基于词向量的短文本分类方法研究[D]. 江大鹏.浙江大学 2015
[8]基于神经网络的文字识别技术研究及应用[D]. 杨天长.北方工业大学 2013
[9]基于CRF的中文命名实体识别研究[D]. 史海峰.苏州大学 2010
[10]主谓关系识别与主题相关性计算技术研究[D]. 杨旭.东北大学 2009



本文编号:2951442

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/2951442.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3a890***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com