当前位置:主页 > 经济论文 > 旅游经济论文 >

结合问句相关度计算的FAQ系统设计

发布时间:2016-12-31 16:18

  本文关键词:新型高端旅游人才创新开发使用模式研究,由笔耕文化传播整理发布。


当前所在位置:中国论文网 > 管理论文发表 > 结合问句相关度计算的FAQ系统设计

结合问句相关度计算的FAQ系统设计

发布日期: 2016-07-19 发布:  

  2016年21期目录       本期共收录文章20篇

2016年21期

  摘 要:随着计算机技术、自然语言理解技术和人工智能技术的发展,我们生活中随处都可以看到FAQ系统。它涉及的领域越来越多,包括智能咨询领域、人工智能领域、培训教育领域等,随着其深入应用到生活中,,用户对其答案的准确度和系统友好性要求越来越高。本文在前人研究的基础之上利用问句相似度计算结合问句相关度进行FAQ系统设计,主要是通过问句的语义相关度对问句进行计算,最终从知识库中返回用户需要的答案。
中国论文网
  关键词:FAQ系统;问句相关度;问句相似度;人工智能
  一、前言
  FAQ系统通过一问一答的形式与提问者进行交流,目前对提问者提问的语句进行计算的方式有两种,一种是基于问句相似度的方式对用户的问题进行分析,然后给出答案,该种方式的准确率目前可以达到80%左右,一种是根据提问者提问问句中词汇的相关度对用户的问句进行计算,该种方式的准确率同样也在80%左右。
  本文主要对在结合问句相关度计算的FAQ系统进行分析,分析的问题计算的方式是采用基于语义相关度的方式结合问句相关度对用户的问题进行计算,来反馈给用户正确和期待的答案。该种结合问句语义相关度的计算方式能够满足用户在人机交互方面的需求,使FAQ系统变得更加人性化,更能够满足用户的需求。目前在各个公共场所都能够看到FAQ系统的存在,例如医院、购物商场、学校、政府大厅等,用户通过FAQ系统可以得到自身所需要的信息,同时对答案的准确性要求也变得相对较高,他们在提问的同时不仅仅关注某一个问题的准确性,他们更希望通过问题的关联性来获取相应的答案。为了满足用户该方面的要求,所以本文对FAQ系统研究与设计具有非常重要的意义。
  二、FAQ系统介绍
  FAQ系统即问答系统,其主要是通过一问一答的形式进行问题的展示和提供指导服务。FAQ系统是目前自然语言理解领域研究和关注的重点,该类系统的特点是允许用户通过自然语言进行问题的提问,系统对用户输入的自然语言进行处理,最终返回用户需要的答案。目前国内和国外的学者对于FAQ系统的研究主要集中在以下三类中:特定领域内的FAQ系统、全领域开放式FAQ系统以及基于用户常见问题集的FAQ系统。
  一般的FAQ系统在进行用户问题处理和答案反馈时一般要经过:问句理解、问句处理、反馈答案。其中问句处理包括汉语分词、问句中关键词提取、对提取的关键词进行同义词替换、通过相似度算法对答案进行计算、对用户的问题进行记录、反馈最接近用户想要的答案。
  目前存在的FAQ系统有完全单机版的,即采用管理员实现收集的知识库来为用户进行服务,也有基于网络的FAQ系统,该种FAQ系统依靠互联网强大的知识库,对答案信息进行抓取来解答用户的问题。专家认为一个成熟,能够进行应用的FAQ系统至少能够对用户提出的问题的百分之八十进行解答,即使不能解答的问题也能够找出相应的相似问题进行解答。再进行FAQ系统应用后不仅能够方便用户对相应的知识信息进行了解,同时也能够解放一部分人力,节省机构、高校等的开支,提高用户对于机构和高校的满意度。
  三、系统设计
  语义相关度是一个综合而且相对模糊的概念,它既包括问句之间的相关度计算又包括问句之间的相似度计算。本文设计的语义相关度计算算法在基于问句语义表征计算的相似度算法之上,添加了前后问句之间的相关度计算。添加相关度计算的目的是使计算的准确率更高、问答系统的友好性更好。
  第一,用户首先需要输入中文问句,系统在用户输入中文问句后对问句进行处理,得到问句的“语义表征”和“问句类型”。
  第二,系统会对用户输入的问题进行判断,如果用户是首次使用我们设计的FAQ系统,那么就不存在前后问句关联性的问题。系统将通过用户的问句的语义表征直接进行问句相似度计算,返回用户所需要的答案。
  第三,如果经过判断,用户输入的问题不是第一个问题,那么系统会对用户目前输入的问题和前一个问题进行相关度计算;然后形成信息的问句语义表征,最后再进行问句相似度计算。
  注:在系统进行问句相关度计算和相似度计算的过程中,都运用了我们建立的领域关键词词典,目的是提高系统的准确率。
  本文设计的结合问句语义相关度计算的FAQ系统的具体流程如下图所示
  图1 结合问句语义相关度计算的FAQ系统流程图
  四、语句相关度计算
  词语之间的相关度是指两个词语之间的相关程度,例如:“统计大学”与“软件学院”在一定程度上具有一定的相关度,因为后者属于前者,目前进行词语相关度计算的算法很多,例如基于《知网》的词语相关度计算、面向语义消岐的词语相关度计算算法等。
  第一,相关度计算算法是在用户进行问题输入的过程中进行的,如果用户输入的是第一个问题,不存在该算法的计算流程。该算法只负责计算用户输入第一个问题后的后续问句。
  第二,有两个概念需要注意,即何为完整问句?何为不完整问句?
  完整问句:我们根据本文建立的领域关键词树来定义完整问句和不完整问句,问句中包含领域关键词树的第一,第二,第三层中的一个词以及第四层中的一次词,就可以定义为完整问句。这里需要注意,必须包含第四层中的词。例如:“同济大学软件学院简介?”包含了第一层中的词“软件学院”;第四层中的词“简介”。所以该问句为完整问句。
  不完整问句:是指不包括第一层,第二层或是第三层中的词,只包括第四层中的词。例如:“简介?”就是一个不完整问句。只包含第一层,第二层或是第三层的词也是一个不完整问句。例如:“统计大学人文学院呢?”就是一个不完整问句。
  第三,首先系统会对用户输入的问句QuesList2进行预处理,得到该问句的语义表征以及问句的类型。对QuesList2进行判断,判断其是否为完整问句,如果QuesList2为完整问句,那么直接利用其语义表征进行问句相似度计算;否则进入(4)。
  第四,对QuesList1和Quextion2的问句语义本文在前人研究的基础之上以及对目前流行的互联网旅游管理系统进行分析,目前基于互联网建设的旅游管理系统应该是一款能够提供全方位服务的信息管理系统。总结归纳出一个基于互联网的旅游管理系统应该的具有的功能至少包括:新闻管理功能、酒店预订功能、旅游线路预定功能、景区订票功能、签证服务功能、留言提问功能、会员注册功能、短信群发功能、邮件群发功能、在线支付功能、SEO优化功能、优惠返利功能、车票飞机票代购功能。
  (作者单位:同济大学)
  参考文献:
  [1] 李雅静.新型高端旅游人才创新开发使用模式研究[D].北京交通大学,2014.
  [2] 张侠.都市旅游发展与政府职能研究[D].华中师范大学,2009.
  [3] 庞彤彤.国家旅游线路评价与初步设计[D].中国海洋大学,2010.
  [4] 凌琳.地理信息系统(GIS)在旅游业中的应用研究[D].复旦大学,2009.
  [5] 梅杏莉.基于C/S和B/S混合型结构的主题公园营运管理信息系统研究[D].暨南大学,2006.
  [6] 舒永钢.WebGIS旅游信息搜索功用研究及应用[D].浙江工商大学,2012.

转载请注明来源。:

在线服务

 


  本文关键词:新型高端旅游人才创新开发使用模式研究,由笔耕文化传播整理发布。



本文编号:229688

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/lyjj/229688.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户94611***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com