基于检索和答案生成混合的问答系统设计与实现
发布时间:2021-05-06 02:07
随着信息技术的飞速发展和互联网的普及,每个人都可以方便地从互联网上获取海量的信息。然而海量的数据也带来了信息爆炸和信息过载的巨大挑战,使得人们陷入了海量数据的汪洋之中,信息的精确定位变得越来越困难。搜索引擎的出现,一定程度上缓解了这些挑战带来的问题。然而,传统的搜索引擎没有挖掘查询更深层次的语义信息,且用户仍需以人工遍历的方式定位信息,费时且费力。问答系统的出现,为信息的精确定位提供了一种全新的解决方案。通过问答系统,用户能以自然语言的方式表达自己的信息需求,系统将直接返回精确、简洁的答案。当前,问答系统常用的模型主要为基于检索的模型和基于答案生成的模型。基于检索的模型有匹配模型简单、答案在语料库中、可解释性强等优点;但由于语料库大小的限制,导致能回答的问题具有局限性,对问题的语义信息挖掘不足。基于答案生成的模型可以通过挖掘问题的深层语义生成答案,答案可以不受语料库的规模限制,但模型的可解释性不强,且倾向于生成通用的、单调的答案,无法保证答案的合理性和一致性。对于问答系统而言,由于语料库数据形式的不同,需要采用的技术也不相同。而在大多数情况下,语料库数据形式又以自由文本和问题答案对数据...
【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校
【文章页数】:89 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 问答系统的研究背景与意义
1.2 本文工作概述
1.2.1 基于检索的问答系统
1.2.2 基于检索和答案生成混合的问答系统
1.3 本文组织结构
1.4 本章小结
第2章 问答系统相关综述
2.1 问答系统的理论背景
2.1.1 问答系统的定义
2.1.2 问答系统的发展
2.1.3 问答系统的分类
2.2 问答系统的相关技术概述
2.2.1 Word2Vec
2.2.2 Paragraph2 Vector模型
2.2.3 Learn to rank模型
2.2.4 循环神经网络
2.2.5 注意力机制
2.3 问答系统的研究现状
2.3.1 HRED
2.3.2 VHRED
2.4 本章小结
第3章 基于检索的问答系统
3.1 问题描述
3.2 系统整体架构
3.3 问题分析
3.3.1 问题预处理
3.3.2 关键词提取和拓展
3.4 信息检索
3.4.1 文本提取和段落分割
3.4.2 知识库构建
3.5 答案排序
3.5.1 语义特征提取
3.5.2 排序模型
3.6 本章小结
第4章 基于检索和答案生成混合的问答系统
4.1 问题描述
4.2 系统结构
4.3 信息检索模型
4.3.1 知识库构建
4.3.2 相似度计算模型
4.4 答案生成模型
4.4.1 模型结构
4.4.2 答案生成
4.5 重排序模型
4.5.1 模型结构
4.5.2 打分函数
4.6 本章小结
第5章 实验设计与结果分析
5.1 基于检索的问答系统的实验
5.1.1 数据来源和数据预处理
5.1.2 实验环境
5.1.3 评价指标
5.1.4 实验设置
5.1.5 实验结果及分析
5.2 基于检索和答案生成混合的问答系统的实验
5.2.1 数据来源及数据预处理
5.2.2 实验环境
5.2.3 评价指标
5.2.4 实验设置
5.2.5 实验参数
5.2.6 实验结果及分析
5.3 本章小结
第6章 总结与展望
6.1 工作总结
6.2 未来展望
6.3 本章小结
参考文献
攻读硕士学位期间主要的研究成果
致谢
【参考文献】:
期刊论文
[1]问答系统研究综述[J]. 毛先领,李晓明. 计算机科学与探索. 2012(03)
本文编号:3171026
【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校
【文章页数】:89 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 问答系统的研究背景与意义
1.2 本文工作概述
1.2.1 基于检索的问答系统
1.2.2 基于检索和答案生成混合的问答系统
1.3 本文组织结构
1.4 本章小结
第2章 问答系统相关综述
2.1 问答系统的理论背景
2.1.1 问答系统的定义
2.1.2 问答系统的发展
2.1.3 问答系统的分类
2.2 问答系统的相关技术概述
2.2.1 Word2Vec
2.2.2 Paragraph2 Vector模型
2.2.3 Learn to rank模型
2.2.4 循环神经网络
2.2.5 注意力机制
2.3 问答系统的研究现状
2.3.1 HRED
2.3.2 VHRED
2.4 本章小结
第3章 基于检索的问答系统
3.1 问题描述
3.2 系统整体架构
3.3 问题分析
3.3.1 问题预处理
3.3.2 关键词提取和拓展
3.4 信息检索
3.4.1 文本提取和段落分割
3.4.2 知识库构建
3.5 答案排序
3.5.1 语义特征提取
3.5.2 排序模型
3.6 本章小结
第4章 基于检索和答案生成混合的问答系统
4.1 问题描述
4.2 系统结构
4.3 信息检索模型
4.3.1 知识库构建
4.3.2 相似度计算模型
4.4 答案生成模型
4.4.1 模型结构
4.4.2 答案生成
4.5 重排序模型
4.5.1 模型结构
4.5.2 打分函数
4.6 本章小结
第5章 实验设计与结果分析
5.1 基于检索的问答系统的实验
5.1.1 数据来源和数据预处理
5.1.2 实验环境
5.1.3 评价指标
5.1.4 实验设置
5.1.5 实验结果及分析
5.2 基于检索和答案生成混合的问答系统的实验
5.2.1 数据来源及数据预处理
5.2.2 实验环境
5.2.3 评价指标
5.2.4 实验设置
5.2.5 实验参数
5.2.6 实验结果及分析
5.3 本章小结
第6章 总结与展望
6.1 工作总结
6.2 未来展望
6.3 本章小结
参考文献
攻读硕士学位期间主要的研究成果
致谢
【参考文献】:
期刊论文
[1]问答系统研究综述[J]. 毛先领,李晓明. 计算机科学与探索. 2012(03)
本文编号:3171026
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3171026.html
最近更新
教材专著