基于非结构化文本的自动问答系统的研究与实现
发布时间:2023-06-01 20:04
近几年随着移动互联网和大数据时代的快速发展,非结构化的网页和各垂直领域的文档急剧积累,基于非结构化文本的自动问答作为信息检索的高级形式,通过解析用户的真实意图,从检索到的文档中抽取简洁准确的答案,近几年逐渐成为研究热点。然而,当前大多公开的研究工作还存在诸多问题:1)问答场景下问句和文档长度严重失衡,信息检索模块中缺乏细粒度语义层面的相似度匹配,难以满足精准化检索需求;2)中文场景下,主流机器阅读理解模型未得到充分验证,性能存在提升空间,3)当前大规模非结构化文本自动问答技术不够成熟,针对某一垂直领域的应用平台相对较少。本文围绕非结构化文本自动问答系统中的文档信息检索和答案抽取的关键技术,进行算法优化和系统实现。主要研究工作包括:(1)提出了一种基于层叠注意力机制的语义相似度匹配模型(Deep-HAN-Matching),解决了问答场景下检索和文档长度严重失衡导致语义相似度匹配困难的问题,从词维度和句子维度利用注意力机制逐层抽象、抽取特征,在WikiQA公开数据集上相比主流基线模型性能提升明显;(2)提出了一种利用门限卷积神经网络和自注意力机制改进BiDAF的机器阅读理解模型(BiDA...
【文章页数】:66 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.2.1 文档信息检索的国内外研究现状
1.2.2 基于机器阅读理解答案抽取的国内外研究现状
1.2.3 非结构化文本自动问答应用的国内外研究现状
1.3 本文主要研究内容和创新点
1.4 硕士在读期间主要完成工作
1.5 本文组织结构
第二章 非结构化文本自动问答系统的研究综述
2.1 非结构化文本自动问答系统的整体架构
2.2 文档信息检索的关键技术研究
2.2.1 传统文档信息检索算法
2.2.2 基于深度学习的文档信息检索算法
2.2.3 小结
2.3 答案抽取的关键技术研究
2.3.1 基于规则的答案抽取算法
2.3.2 基于机器阅读理解的答案抽取算法
2.3.3 小结
2.4 问答系统中的常用评价指标
2.4.1 文档信息检索的评价指标
2.4.2 自动问答的评价指标
2.5 本章小结
第三章 融合语义相似度匹配的文档信息检索算法
3.1 具体研究挑战
3.2 解决方案
3.3 基于层叠注意力机制的语义相似度匹配算法的研究与实现
3.3.1 模型整体架构
3.3.2 关键技术
3.4 实验设置与结果分析
3.5 本章小结
第四章 基于BiDAF改进的机器阅读理解答案抽取算法
4.1 具体研究挑战
4.2 解决方案
4.3 基于BiDAF改进的机器阅读理解算法的研究与实现
4.3.1 模型整体架构
4.3.2 关键技术
4.4 实验设置与结果分析
4.5 本章小结
第五章 临床医学领域自动问答系统的研究与实现
5.1 研究目的和需求分析
5.1.1 研究目的
5.1.2 需求分析
5.2 临床医学数据集构建
5.3 系统整体架构和处理流程
5.4 系统测试和结果分析
5.4.1 语义相似度匹配实验与结果分析
5.4.2 机器阅读理解实验与结果分析
5.4.3 问答系统运行测试和结果分析
5.4.4 临床医学执业医师考试测试与结果分析
5.5 本章小结
第六章 总结与展望
6.1 工作总结
6.2 研究展望
参考文献
致谢
攻读学位期间取得的研究成果
本文编号:3826957
【文章页数】:66 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.2.1 文档信息检索的国内外研究现状
1.2.2 基于机器阅读理解答案抽取的国内外研究现状
1.2.3 非结构化文本自动问答应用的国内外研究现状
1.3 本文主要研究内容和创新点
1.4 硕士在读期间主要完成工作
1.5 本文组织结构
第二章 非结构化文本自动问答系统的研究综述
2.1 非结构化文本自动问答系统的整体架构
2.2 文档信息检索的关键技术研究
2.2.1 传统文档信息检索算法
2.2.2 基于深度学习的文档信息检索算法
2.2.3 小结
2.3 答案抽取的关键技术研究
2.3.1 基于规则的答案抽取算法
2.3.2 基于机器阅读理解的答案抽取算法
2.3.3 小结
2.4 问答系统中的常用评价指标
2.4.1 文档信息检索的评价指标
2.4.2 自动问答的评价指标
2.5 本章小结
第三章 融合语义相似度匹配的文档信息检索算法
3.1 具体研究挑战
3.2 解决方案
3.3 基于层叠注意力机制的语义相似度匹配算法的研究与实现
3.3.1 模型整体架构
3.3.2 关键技术
3.4 实验设置与结果分析
3.5 本章小结
第四章 基于BiDAF改进的机器阅读理解答案抽取算法
4.1 具体研究挑战
4.2 解决方案
4.3 基于BiDAF改进的机器阅读理解算法的研究与实现
4.3.1 模型整体架构
4.3.2 关键技术
4.4 实验设置与结果分析
4.5 本章小结
第五章 临床医学领域自动问答系统的研究与实现
5.1 研究目的和需求分析
5.1.1 研究目的
5.1.2 需求分析
5.2 临床医学数据集构建
5.3 系统整体架构和处理流程
5.4 系统测试和结果分析
5.4.1 语义相似度匹配实验与结果分析
5.4.2 机器阅读理解实验与结果分析
5.4.3 问答系统运行测试和结果分析
5.4.4 临床医学执业医师考试测试与结果分析
5.5 本章小结
第六章 总结与展望
6.1 工作总结
6.2 研究展望
参考文献
致谢
攻读学位期间取得的研究成果
本文编号:3826957
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3826957.html