基于深度学习的知识问答研究
发布时间:2023-05-03 22:08
知识问答的目的是根据用户提出的自然语言问题,基于知识库给出精确的答案。近些年数据挖掘、信息抽取技术的快速发展,推动了大规模且涵盖领域丰富的知识库的涌现,为基于知识库的问答研究提供了数据基础。由于自然语言问题表达方式的多样性,如何获取问题中的主题实体,并精确的将自然语言问题和知识库中的结构化三元组进行匹配是本文研究的重点。本文将知识问答任务分为两个阶段:主题实体识别和候选三元组排序。在主题实体识别阶段首先使用基于深度学习和迁移学习的实体识别模型得到问题的主题实体;在候选三元组排序阶段分别计算问题和候选三元组的语义相似度和字符相似度,并通过融合进行排序。NLPCC-ICCPOL 2016 KBQA任务发布了大规模的中文知识库和相关的问答数据集,本文在该数据集上进行实验并取得了出色的成绩。本文的主要贡献如下:本文提出迁移深度实体识别模型,将迁移学习和深度学习结合起来用到命名实体识别中。通过将外部中文分词工具的词性标注结果融入到实体识别训练的输入中,解决实体识别数据集过小的问题。并且在双向长短时记忆网络(Bi-LSTM)和条件随机场(CRF)之间加入多头注意力机制提取问题中任意两个字符之间的语...
【文章页数】:74 页
【学位级别】:硕士
【文章目录】:
致谢
摘要
abstract
1 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.3 本文研究内容
1.4 论文的组织结构
2 相关理论技术
2.1 知识库和问答数据集
2.2 命名实体识别
2.3 语义匹配
2.4 实体链接
2.5 深度学习理论
3 基于迁移深度实体识别模型的主题实体识别
3.1 引言
3.2 数据集构建
3.3 模型结构
3.4 迁移深度实体识别模型
3.5 实体链接
3.6 实验结果与分析
3.7 本章小结
4 基于双向LSTM和卷积神经网络的双层次语义匹配
4.1 引言
4.2 数据集构建
4.3 模型结构
4.4 双层次语义匹配模型
4.5 实验结果与分析
4.6 本章小结
5 总结和展望
5.1 论文总结
5.2 研究展望
参考文献
作者简历
学位论文数据集
本文编号:3807374
【文章页数】:74 页
【学位级别】:硕士
【文章目录】:
致谢
摘要
abstract
1 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.3 本文研究内容
1.4 论文的组织结构
2 相关理论技术
2.1 知识库和问答数据集
2.2 命名实体识别
2.3 语义匹配
2.4 实体链接
2.5 深度学习理论
3 基于迁移深度实体识别模型的主题实体识别
3.1 引言
3.2 数据集构建
3.3 模型结构
3.4 迁移深度实体识别模型
3.5 实体链接
3.6 实验结果与分析
3.7 本章小结
4 基于双向LSTM和卷积神经网络的双层次语义匹配
4.1 引言
4.2 数据集构建
4.3 模型结构
4.4 双层次语义匹配模型
4.5 实验结果与分析
4.6 本章小结
5 总结和展望
5.1 论文总结
5.2 研究展望
参考文献
作者简历
学位论文数据集
本文编号:3807374
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3807374.html