选择题型机器阅读理解的研究

发布时间:2021-02-27 01:04
  机器阅读理解是测评机器对自然语言文本理解能力的重要任务,是人工智能水平的一个重要标志。选择题型机器阅读理解是给出文章和问题,让机器从多个答案候选项中选择出正确答案。这些答案候选项通常不是给定文章中的文本片段,而是根据文章内容改写的表述、总结归纳,甚至需要对文章或借助外部常识知识进行推理获得的信息,因此该任务有较高的语义理解要求。本文从语义匹配、语义推理和外部知识辅助三个方面研究选择题型的机器阅读理解任务。本文采用一个鲁棒性强的Co-Matching模型作为基础模型,该模型在交互层中将问题和候选项分别与文章进行同时匹配。但该模型有两个不足,一是语义匹配方式不够全面,未考虑到问题和候选项之间往往存在信息互补,二是缺乏语义推理。因此,本文第一个工作增加了问题与候选项的互补信息,并将其与文章进行语义匹配,实验结果表明此改进有助于提高模型的语义匹配能力。通常选择题型任务的答案不是原文片段,模型往往需要深入理解文本含义,进行语义推理。因此,针对Co-Matching模型的第二个不足,本文第二个工作是在第一个工作进行语义匹配的基础上提出并增加两种多步推理方法。为了使每一步推理不仅只依赖前一步的结果,... 

【文章来源】:华东师范大学上海市 211工程院校 985工程院校 教育部直属院校

【文章页数】:82 页

【学位级别】:硕士

【部分图文】:

选择题型机器阅读理解的研究


来自数据集CBTest的典型完形填空任务数据样例

数据集,片段,数据,选择题


华东师范大学硕士学位论文第一章绪论4图1-2来自数据集SQuAD的典型片段抽取型任务数据样例图1.2.3选择题型选择题型机器阅读理解是指给定一篇文章、问题以及问题对应的候选项集合,集合中存在若干答案候选项,机器需从候选项集合中选择出正确的答案。选择题型机器阅读理解任务可用符号表示正式定义如下:给机器一条三元组数据样例,,OPQD,其中D表示一篇文章,Q表示问题,OP表示答案候选项集合,机器需从答案候选项集合OP中选择正确的候选项作为预测答案输出。典型的选择题型数据集有MCTest[6]、RACE[7]和MCScript[8]等。图1-3中展示了一个来源于MCScript数据集,需外部知识辅助的选择题型数据样例,问题询问种树工具,但整篇文章都未明确提到种树工具,只说明种树过程中挖洞(下划线句子),模型需要知道铲子可以用来挖洞这一外部知识才方便选出正确答案。图1-3来自数据集MCScript的典型选择题型任务数据样例图

选择题,数据集,数据,答案


华东师范大学硕士学位论文第一章绪论4图1-2来自数据集SQuAD的典型片段抽取型任务数据样例图1.2.3选择题型选择题型机器阅读理解是指给定一篇文章、问题以及问题对应的候选项集合,集合中存在若干答案候选项,机器需从候选项集合中选择出正确的答案。选择题型机器阅读理解任务可用符号表示正式定义如下:给机器一条三元组数据样例,,OPQD,其中D表示一篇文章,Q表示问题,OP表示答案候选项集合,机器需从答案候选项集合OP中选择正确的候选项作为预测答案输出。典型的选择题型数据集有MCTest[6]、RACE[7]和MCScript[8]等。图1-3中展示了一个来源于MCScript数据集,需外部知识辅助的选择题型数据样例,问题询问种树工具,但整篇文章都未明确提到种树工具,只说明种树过程中挖洞(下划线句子),模型需要知道铲子可以用来挖洞这一外部知识才方便选出正确答案。图1-3来自数据集MCScript的典型选择题型任务数据样例图


本文编号:3053445

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3053445.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户7f19f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com