当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于图书的问答系统的设计实现和关键技术

发布时间:2017-04-20 10:03

  本文关键词:基于图书的问答系统的设计实现和关键技术,由笔耕文化传播整理发布。


【摘要】:随着互联网的迅速发展,人们获取信息和知识的途径越来越多样化,基于常问问题集(FAQ)的问答系统便是其中一个有效的方式。与传统的搜索引擎相比,FAQ问答系统能够直接返回用户所提出问题的答案,提高了用户知识获取的效率。同时FAQ问答系统是自然语言处理领域中一个相当活跃的分支。FAQ的构建与更新、问题的分析与相似度计算等都是FAQ问答系统中的研究热点和核心内容。数字图书馆中有大量专业的图书资源,其中,问答类型的图书通常是针对一个或者多个领域进行专业性的知识问答,因此会形成大量问答对,而这些问答对就是常问问题集不可或缺的部分。并且,相对于其他常问问题集,它们更能够提供专业性强且准确度高的答案。本论文针对问答类型的图书资源,首先对问答系统的研究现状做了详细分析,介绍了问答系统的基本架构和相关理论基础,介绍了基本的分词方法、主题模型、问题相似度计算方法。然后设计并实现了一个基于图书的问答系统。论文的主要工作如下:(1)分析基于图书的问答系统的需求,并针对需求进行系统分析和设计。提出了系统的架构设计和模块设计,实现了基于图书的问答系统并上线运行。(2)针对系统的数据需求,通过正则匹配等技术从大量的图书资源中筛选出问答类型的图书,然后抽取问答图书的目录信息,通过字符串匹配等方法过滤掉其中的噪音信息,最终获取问答类图书中的问题对数据,以此构建FAQ库。(3)重点研究了问题分析和问题相似度计算的相关技术,并结合问题数据的结构、主题和短文本等特征提出了针对图书问题检索的核心算法,包括:基于BTM的问题主题分析,基于Topic和Focus的问题相似度计算。设计相关实验并与传统算法比较,实验结果表明论文所提出算法明显提高了问题回答的准确度。
【关键词】:常问问题集 图书问答系统 问题相似度 短文本 问题分析
【学位授予单位】:浙江大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.1
【目录】:
  • 摘要5-6
  • Abstract6-12
  • 第1章 绪论12-17
  • 1.1 课题背景和意义12-13
  • 1.2 本文的主要工作13-14
  • 1.3 本文使用的图书数据介绍14-15
  • 1.4 本文的组织结构15-16
  • 1.5 本章小结16-17
  • 第2章 相关研究和工作综述17-34
  • 2.1 问答系统17-20
  • 2.1.1 FAQ问答系统17-19
  • 2.1.2 FAQ问答系统核心问题19-20
  • 2.2 问题分析算法研究现状20-29
  • 2.2.1 问题分类算法21-22
  • 2.2.2 问题主题识别算法22-29
  • 2.3 问题相似度算法研究现状29-31
  • 2.3.1 基于向量空间模型的TF-IDF方法29
  • 2.3.2 基于语义词典的语句相似度计算方法29-30
  • 2.3.3 基于大规模文档集的语句相似度计算方法30-31
  • 2.3.4 基于编辑距离的计算方法31
  • 2.4 常用分词工具31-32
  • 2.5 本章小结32-34
  • 第3章 基于图书的问答系统设计34-54
  • 3.1 基于图书的问答系统的研发目标34
  • 3.2 基于图书的问答系统的需求分析34-35
  • 3.2.1 数据需求34-35
  • 3.2.2 功能需求35
  • 3.3 基于图书的问答系统的架构设计35-43
  • 3.3.1 系统体系架构36-38
  • 3.3.2 系统运行架构38-43
  • 3.4 基于图书的问答系统的模块设计和实现43-53
  • 3.4.1 FAQ模块43-45
  • 3.4.2 问题分析模块45-48
  • 3.4.3 问题检索模块48-49
  • 3.4.4 排序和候选集生成模块49-50
  • 3.4.5 前端交互模块50-53
  • 3.5 本章小结53-54
  • 第4章 基于图书的问答系统关键技术54-64
  • 4.1 问题主题分析55-58
  • 4.2 问题相似度计算58-63
  • 4.3 本章小结63-64
  • 第5章 实验及结果分析64-75
  • 5.1 实验数据集64
  • 5.2 问题主题分析实验64-69
  • 5.3 问题相似度计算实验69-74
  • 5.3.1 评价标准69-70
  • 5.3.2 实验过程及结果分析70-74
  • 5.4 本章小结74-75
  • 第6章 总结与展望75-77
  • 6.1 工作总结75
  • 6.2 展望75-77
  • 参考文献77-80
  • 攻读硕士学位期间主要的研究成果80-81
  • 致谢81

【相似文献】

中国期刊全文数据库 前10条

1 毛先领;李晓明;;问答系统研究综述[J];计算机科学与探索;2012年03期

2 莫丽萍,王树西,姜吉发,雷雨霞;问答系统和浅层结构模式推理[J];广西师范大学学报(自然科学版);2004年01期

3 卢志坚,张冬茉;中文问答系统中的问句理解[J];计算机工程;2004年18期

4 王树西;问答系统:核心技术、发展趋势[J];计算机工程与应用;2005年18期

5 林晓庆;;问答系统中基于列表类问题的研究[J];电脑知识与技术(学术交流);2007年07期

6 张积宾;徐志明;王恒;潘启树;;面向大规模网络数据的社会化问答系统[J];哈尔滨工业大学学报;2008年12期

7 贾君枝;毛海飞;;汉语框架网络问答系统问句处理研究[J];图书情报工作;2008年10期

8 胡小华;刘轩;刘丹;陆伟;;基于冗余的仿真问答系统的轻量级局部文本分析[J];图书情报知识;2009年01期

9 张中峰;李秋丹;;社区问答系统研究综述[J];计算机科学;2010年11期

10 陈玉;;基于“为什么”问句的中文问答系统研究[J];农业网络信息;2010年11期

中国重要会议论文全文数据库 前10条

1 何靖;陈,

本文编号:318411


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/318411.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户93e77***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com