当前位置:主页 > 科技论文 > 软件论文 >

智能问答系统的研究与实现

发布时间:2017-07-28 22:06

  本文关键词:智能问答系统的研究与实现


  更多相关文章: 大数据 下一代搜索引擎 自然语言理解 智能问答 知识获取


【摘要】:智能问答改变了传统搜索引擎返回超链接的方式,能把海量的互联网信息转化为知识,并能够理解用户的自然语言问题和意图,快速、准确地直接给予答案,大大减少了用户查找信息的时间,是下一代智能搜索服务的发展方向。本文主要完成了智能问答系统的设计与实现,该系统能够理解中文自然语言问题,从本地知识库以及Web数据中快速地找到所需的信息。该系统主要包括问句理解和答案检索两大模块。问句理解包括词法分析、问句分类、主体识别、谓词识别与消歧以及问句元转换。答案检索包括基于RDF知识库的答案检索和基于Web的答案检索。中文分词与词性标注是中文文本语义理解的基础,也是本文所实现的智能问答系统的关键步骤。本文针对现有中文分词中词性标注存在忽略上下文信息的问题,基于最大熵和分词词典相结合的方法,改进了兼类词的词性标注过程。本文将自然语言问句分为:人物类、电影类、音乐类、图书类、游戏类、应用类等六个类别。采用CRF(Conditional Random Field,条件随机场)自定义组合特征和自定义标注集获取问句的类别和问句的主体。采用词典匹配和句法分析获得问句中的谓词,并使用词语相似度计算方法对谓词进行消歧,该处理使问句中的谓词和RDF知识库中的属性名称相一致。给出问句元的定义并将问句转换为问句元。问句元是由“[主体,谓词]”组成的自然语言问句结构化表示形式。问句元的转换准确率决定对问句的理解是否准确。答案检索采用两种方法:基于RDF知识库和基于Web。RDF知识库中存放有大量知识三元组,知识三元组涉及人物、电影、音乐、图书、游戏、应用六个类别。本文在问句理解基础上,依次对问句进行分类、主体识别、谓词识别与消歧以及问句元转换,并根据问句元将问句转化为SPARQL结构化查询语言,从RDF知识库中抽取答案。如果在RDF知识库中没有检索到答案,则采用基于Web的方法进行答案的检索。该方法将问句作为搜索引擎的查询请求,从返回的查询结果中抽取答案。
【关键词】:大数据 下一代搜索引擎 自然语言理解 智能问答 知识获取
【学位授予单位】:西南交通大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.1
【目录】:
  • 摘要6-7
  • abstract7-11
  • 第1章 绪论11-22
  • 1.1 智能问答研究背景和意义11-13
  • 1.2 智能问答研究现状13-16
  • 1.3 论文研究目标16
  • 1.4 论文拟解决的关键问题16-17
  • 1.5 智能问答系统处理流程及模块组成17-20
  • 1.5.1 智能问答系统处理流程17-18
  • 1.5.2 问句理解18-19
  • 1.5.3 答案检索19-20
  • 1.6 论文的章节安排20
  • 1.7 本章小结20-22
  • 第2章 相关技术介绍22-31
  • 2.1 句法分析22-23
  • 2.2 机器学习算法23-30
  • 2.2.1 条件随机场算法(CRF)23-27
  • 2.2.2 最大熵词性标注算法27-30
  • 2.3 本章小结30-31
  • 第3章 问句理解31-55
  • 3.1 语料收集31
  • 3.2 问句介绍31-33
  • 3.3 词法分析33-41
  • 3.3.1 中文分词33
  • 3.3.2 词性标注33-41
  • 3.4 问句分类41-43
  • 3.4.1 问句分类流程及原理41-43
  • 3.4.2 问句分类实验结果与分析43
  • 3.5 主体识别43-46
  • 3.5.1 人物类问句的主体识别43-44
  • 3.5.2 非人物类问句的主体识别44-45
  • 3.5.3 主体识别实验结果与分析45-46
  • 3.6 谓词识别46-50
  • 3.6.1 谓词词典构建46-47
  • 3.6.2 基于属性词典和句法分析结合的谓词识别47-49
  • 3.6.3 谓词识别实验结果与分析49-50
  • 3.7 谓词消歧50-52
  • 3.8 问句元转换52-54
  • 3.8.1 问句元转换规则52-54
  • 3.8.2 问句元转化实验结果与分析54
  • 3.9 本章小结54-55
  • 第4章 答案检索55-71
  • 4.1 知识获取55-56
  • 4.2 基于RDF知识库的答案检索56-68
  • 4.2.1 SPARQL简介57-60
  • 4.2.2 SPARQL结构化查询语句60-62
  • 4.2.3 SPARQL结构化查询模板62-65
  • 4.2.4 答案提取65-68
  • 4.3 基于Web的答案检索68-69
  • 4.4 本章小结69-71
  • 第5章 智能问答系统部署与演示71-79
  • 5.1 系统部署71
  • 5.2 系统演示71-77
  • 5.2.1 基于RDF知识库的答案检索演示72-77
  • 5.2.2 基于Web的答案检索演示77
  • 5.3 本章小结77-79
  • 结论79-80
  • 致谢80-81
  • 参考文献81-87
  • 攻读硕士学位期间发表的论文及科研成果87

【相似文献】

中国期刊全文数据库 前10条

1 毛先领;李晓明;;问答系统研究综述[J];计算机科学与探索;2012年03期

2 莫丽萍,王树西,姜吉发,雷雨霞;问答系统和浅层结构模式推理[J];广西师范大学学报(自然科学版);2004年01期

3 卢志坚,张冬茉;中文问答系统中的问句理解[J];计算机工程;2004年18期

4 王树西;问答系统:核心技术、发展趋势[J];计算机工程与应用;2005年18期

5 林晓庆;;问答系统中基于列表类问题的研究[J];电脑知识与技术(学术交流);2007年07期

6 张积宾;徐志明;王恒;潘启树;;面向大规模网络数据的社会化问答系统[J];哈尔滨工业大学学报;2008年12期

7 贾君枝;毛海飞;;汉语框架网络问答系统问句处理研究[J];图书情报工作;2008年10期

8 胡小华;刘轩;刘丹;陆伟;;基于冗余的仿真问答系统的轻量级局部文本分析[J];图书情报知识;2009年01期

9 张中峰;李秋丹;;社区问答系统研究综述[J];计算机科学;2010年11期

10 陈玉;;基于“为什么”问句的中文问答系统研究[J];农业网络信息;2010年11期

中国重要会议论文全文数据库 前10条

1 何靖;陈,

本文编号:586229


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/586229.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d76ba***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com