当前位置:主页 > 科技论文 > 自动化论文 >

基于文本蕴含识别的答案验证技术研究

发布时间:2022-10-05 17:10
  近年来随着人工智能的火热,自动问答技术得到了广泛的关注。问答系统和传统的搜素引擎根本性的不同在于问答系统可以返回给用户精确的答案,而不是候选的一些列表,为了确保答案的准确,问答系统在返回答案给用户前需要对返回结果进行验证,如何应用文本蕴含识别的方法进行答案验证即为本课题的主要研究内容。因为缺乏大规模的中文蕴含语料,为应用基于深度学习的文本蕴含识别方法,本课题首先采用百度翻译翻译英文的SNLI语料到中文,构建中文的蕴含语料。然后我们根据翻译的中文蕴含语料训练文本蕴含识别的模型。本课题分别训练了三种基于匹配编码的文本蕴含识别模型,应用于后面答案验证技术的研究。问答系统的返回结果主要分为词汇级和句子级的答案,本课题针对词汇级和句子级的答案分别进行研究。针对词汇级的答案,答案可能来自于知识库、百度知道,我们采用知识库三元组拼接、知道问句和答案改写成陈述句做为蕴含前件,问题和答案改写为陈述句做为蕴含后件判断蕴含进行答案验证。针对句子级的答案,答案可能来自百度知道和百度百科,采用答案作为蕴含前件判断蕴含、由答案生成问题再判断问句间的蕴含关系进行答案验证。此外,有些问答系统返回的答案既不是词汇也不是... 

【文章页数】:56 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第1章 绪论
    1.1 课题背景及研究目的和意义
        1.1.1 课题背景
        1.1.2 课题研究的目的和意义
    1.2 国内外研究现状
        1.2.1 国外研究现状
        1.2.2 国内研究现状
        1.2.3 国内外研究现状简析
    1.3 本文研究内容及章节安排
        1.3.1 本文研究内容
        1.3.2 本文章节安排
第2章 词汇级答案的答案验证研究
    2.1 引言
    2.2 数据集构建
        2.2.1 训练数据集-SNLI
        2.2.2 词汇级答案测试集构建
    2.3 基于深度学习的文本蕴含识别的两类模型
        2.3.1 基于句子编码的文本蕴含识别模型
        2.3.2 基于匹配编码的文本蕴含识别模型
    2.4 基于匹配编码文本蕴含识别的词汇级答案验证研究
        2.4.1 分解注意力模型介绍
        2.4.2 增强序列推断模型介绍
        2.4.3 依赖阅读双向LSTM模型介绍
        2.4.4 词汇级答案验证方法
    2.5 实验与分析
        2.5.1 实验设置
        2.5.2 实验结果与分析
    2.6 本章小结
第3章 句子级答案的答案验证研究
    3.1 引言
    3.2 问句生成
        3.2.1 序列到序列模型概述
        3.2.2 注意力机制
    3.3 基于序列到序列模型的句子级答案验证
        3.3.1 训练集构建-QNLI
        3.3.2 句子级答案测试集构建
        3.3.3 句子级答案验证方法
    3.4 实验结果与分析
        3.4.1 实验设置
        3.4.2 实验结果与分析
    3.5 答案验证模块对问答系统的作用
        3.5.1 深度问答系统
        3.5.2 实验结果与分析
    3.6 本章小结
第4章 段落级答案的答案验证研究
    4.1 引言
    4.2 基于文本蕴含对齐和关键词的段落级答案验证研究
        4.2.1 文本蕴含中的对齐
        4.2.2 关键词获取
        4.2.3 基于文本蕴含对齐和关键词的段落级答案验证方法
    4.3 实验结果与分析
        4.3.1 段落级答案测试集的构建
        4.3.2 实验结果及分析
    4.4 本章小结
结论
参考文献
攻读硕士学位期间发表的论文及其它成果
致谢


【参考文献】:
期刊论文
[1]基于知识话题模型的文本蕴涵识别[J]. 任函,盛雅琦,冯文贺,刘茂福.  中文信息学报. 2015(06)
[2]基于文本蕴含的选择类问题解答技术研究[J]. 王宝鑫,郑德权,王晓雪,赵姗姗,赵铁军.  北京大学学报(自然科学版). 2016(01)
[3]多特征文本蕴涵识别研究[J]. 赵红燕,刘鹏,李茹,王智强.  中文信息学报. 2014(02)
[4]基于FrameNet框架关系的文本蕴含识别[J]. 张鹏,李国臣,李茹,刘海静,石向荣,Collin Baker.  中文信息学报. 2012(02)

硕士论文
[1]面向问答的问句关键词提取技术研究[D]. 王煦祥.哈尔滨工业大学 2016



本文编号:3686174

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3686174.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e07ae***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com