基于神经网络的中文多文本阅读理解模型研究
发布时间:2021-04-14 16:09
机器阅读理解是自然语言处理领域重要的研究方向,根据提供的文本数量,可以分为单文本阅读理解模型和多本文阅读理解模型,鉴于后者具有更高的挑战性和实际应用价值,本文专注于多文本阅读理解模型在中文阅读理解数据集的研究,模型的架构包括段落选择器和文本阅读器。对于给定的问题、文档和参考答案,首先,通过段落选择器从文档中选出与参考答案相关性较高的段落,然后,文本阅读器在选择的段落上完成阅读工作,并预测出答案的范围。针对段落选择器和文本阅读器的任务,本文的主要研究工作包括:1、提出两种基于卷积神经网络的段落选择器,分别是二分类版本和多分类版本。两种选择器均将段落选择转化为分类的任务,首先,预训练问题和段落中单词的词向量,然后,使用双向长短时记忆网路分别对问题、段落中的上下文信息进行编码,接着,使用注意力机制层匹配问题和段落的语义信息,强调与问题相关性高的段落内容。下一步,使用卷积神经网络提取段落中重要的特征,生成段落的特征向量。最后,二分类版选择器使用段落特征向量预测段落包含答案的概率,选择概率较高的段落;多分类版选择器进一步计算段落与问题的语义相似度,选择相似度较高的段落。2、对于文本阅读器任务,实...
【文章来源】:厦门大学福建省 211工程院校 985工程院校 教育部直属院校
【文章页数】:75 页
【学位级别】:硕士
【部分图文】:
图2-2循环神经网络结构图??
图2-3?LSTM网络结构1351??
图2-5最大池化层??
本文编号:3137617
【文章来源】:厦门大学福建省 211工程院校 985工程院校 教育部直属院校
【文章页数】:75 页
【学位级别】:硕士
【部分图文】:
图2-2循环神经网络结构图??
图2-3?LSTM网络结构1351??
图2-5最大池化层??
本文编号:3137617
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3137617.html
最近更新
教材专著