自动问答系统的研究与应用
发布时间:2017-10-05 02:37
本文关键词:自动问答系统的研究与应用
更多相关文章: 自动问答 问题分类 中文分词 关键词扩展 答案抽取
【摘要】:当今是一个互联网的时代,也是一个信息爆炸的时代,用户的检索需求正在逐渐地发生变化。现有的搜索引擎一般只提供基于关键字组合的查询,根据用户输入的查询条件返回一个包含关键字或满足查询查询条件的排序的网页集,无法满足精确搜索的需求。基于自然语言处理技术的问答系统是对传统搜索引擎的一种改进。问答系统输入的是以自然语言形式表达的问句,通过提取问句中的查询信息,解析用户的查询意图,然后根据查询意图从文档中精准定位答案所在,最终将自然语言形式的答案抽取出来返回给用户,而不仅是将问题的答案文档返回给用户。这不仅提高了检索的精确度还更好地满足了用户的检索体验。 本文的主要工作是对自动问答系统及其应用进行研究。首先给出一种自动问答系统的整体设计方案,然后对其中的问题分类、关键词扩展和答案抽取三个核心模块进行了详细设计和算法改进。在问题分类模块,在分析现有分词和分类模型的基础上,提出一种朴素贝叶斯和SVM(Support Vector Machine)相结合的问题分类算法;在关键词扩展模块,在总结抽取流程的基础上提出一种知网和同义词词典相结合的关键词扩展算法;在答案抽取模块,提出一种基于语义依存关系的答案抽取算法。最后,给出了一个自动问答系统的应用实例,即基于Nginx,扩展Nginx原有的指令集并将问答处理部分封装成可动态加载的模块,在此基础上实现了一个可应用于实用的自动问答系统服务端。
【关键词】:自动问答 问题分类 中文分词 关键词扩展 答案抽取
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.1
【目录】:
- 摘要4-5
- abstract5-9
- 第一章 绪论9-13
- 1.1 课题的研究背景和意义9-10
- 1.2 国内外相关研究工作10-12
- 1.3 本文研究目标及主要研究内容12
- 1.4 本文组织结构12-13
- 第二章 关键技术介绍13-17
- 2.1 问题分类13-14
- 2.2 关键词扩展与抽取14-15
- 2.3 答案抽取15-17
- 第三章 需求分析与整体设计17-20
- 3.1 需求分析17-18
- 3.2 系统整体设计18-19
- 3.2.1 系统整体设计图18
- 3.2.2 系统整体流程18-19
- 3.3 本章小结19-20
- 第四章 系统详细设计20-42
- 4.1 问题分类模块20-29
- 4.1.1 文本预处理与分词20-21
- 4.1.2 基于互信息的统计分词方法21
- 4.1.3 基于字典的分词方法21-23
- 4.1.4 基于隐马尔科夫模型的分词方法23
- 4.1.5 基于规则的问题分类23-25
- 4.1.6 朴素贝叶斯分类25-27
- 4.1.7 一种朴素贝叶斯和SVM相结合的分类方法27-29
- 4.2 关键词扩展模块29-34
- 4.2.1 去停用词29-30
- 4.2.2 关键词抽取30
- 4.2.3 基于同义词词典的关键词扩展30-31
- 4.2.4 基于知网的关键词扩展31-33
- 4.2.5 两者相结合的关键词扩展33-34
- 4.3 答案抽取模块34-42
- 4.3.1 文本索引设计34-35
- 4.3.2 文档检索模型35-36
- 4.3.3 答案抽取方法36-37
- 4.3.4 答案抽取一般流程37-38
- 4.3.5 基于语义依存关系的答案抽取方法38-42
- 第五章 应用实例--基于Nginx的自动问答系统42-52
- 5.1 Nginx简介42-43
- 5.2 基于Nginx的自动问答系统的服务端的实现43-48
- 5.3 处理过程示例48-50
- 5.4 系统效果评测50-52
- 第六章 总结与展望52-53
- 6.1 总结52
- 6.2 展望52-53
- 参考文献53-57
- 致谢57
【参考文献】
中国期刊全文数据库 前1条
1 张亮;王树梅;黄河燕;张孝飞;;面向中文问答系统的问句句法分析[J];山东大学学报(理学版);2006年03期
,本文编号:974337
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/974337.html