基于深度学习的问题回答技术研究

发布时间:2021-12-11 19:15
  随着计算机技术的发展及互联网的繁荣,信息资源日渐丰富,大量数据以文本的方式存在于互联网中,为人们生活带来了极大的便利。如何快速筛选获取有价值的信息成为当前所面临的难题。传统的问答系统可以利用现有的知识存储帮助用户获取信息,但是无法准确定位用户意图,实现快速高效的交互需求。相比之下,智能问答系统能够以一问一答的自然语言形式,挖掘潜在语义信息,快速高效的满足用户的信息需求。本文研究中文问答系统中的答案选择任务,任务描述如下:给定一个问题q及其对应的候选答案集,目标是从候选答案集中找出与问题最为匹配的答案。其中,问题与答案句子的长度并不固定,并且一个问题可对应于多个正确答案。该任务的本质为计算问题语句与答案语句之间的语义相似度。近年来,深度学习已经广泛应用于自然语言处理领域,相比于传统的机器学习,其无需依赖于手工提取特征、语言工具或外部知识。因此,本文基于深度学习研究问题回答技术。本论文中的基本答案选择模型为:基于注意力机制的BiLSTM模型。在此模型的基础上,我们从向量化表示和模型扩展两个角度分别进行了改进。首先,面向向量化,我们提出了一种字词混合向量化方法用于生成问题与答案更为丰富的向量... 

【文章来源】:北方工业大学北京市

【文章页数】:69 页

【学位级别】:硕士

【部分图文】:

基于深度学习的问题回答技术研究


图2-1?Skip-Gram模式下的语境与目标词汇间映射实例??训练时,\Vord2Vec模型除按照上图所示的方法构造训练样例外,还需要构??造随机词汇作为负样本

前馈神经网络


第二章相关技术与技术研究??整个网络结构中没有反馈过程。具体网络如图2-2所示:??_??输入层?隐藏层?输出层??图2-2前馈神经网络??输入层负责整个网络的输入,无计算能力;而其他层拥有具备计算能力的节??点(计算单元),有多个输入,但仅有一个输出。从输入层到输出层,可将网络分??为第0至第N层,输入层和最后的输出层称为“可见层”,而中间层称为“隐??藏层”。其中,计算单元又称为“神经元”,其结构如图2-3所示:??输入1??输入m?加权?激活层??图2-3神经元结构??神经元对数据的处理可分为两阶段:第一阶段:当前神经元接受来自其他m??个祌经元的输入,然后与相应权重加权求和,此阶段称为预激活阶段,具体公式??如(2-1)所示:??8??

卷积核,局部连接,子区域,图像


第二章相关技术与技术研宄??和池化层。??2.3.1卷积层??卷积层(Convolutional?Layer)通过局部感知、参数共享实现对数据的降维??处理,并可自动完成对于原始输入数据的特征提取工作。??其设计由3个部分构成。??(1)局部连接??当处理高维的输入数据时,神经网络结构的全连接方式不仅需要耗费大量的??训练时间,而且浪费空间资源。而在卷积层中,每个神经元仅需与上一层的部分??神经元相连接,即局部连接。以28x28的图像为例,局部连接的工作原理如图??2-4所示。??28X28图像??

【参考文献】:
硕士论文
[1]基于深度学习和主题模型的问答系统算法研究[D]. 詹国辉.华南理工大学 2018
[2]基于深度学习的QA答案选择算法研究[D]. 王梓良.北京邮电大学 2018
[3]深度学习与多元特征相结合的答案选择排序研究[D]. 赵姗姗.哈尔滨工业大学 2016
[4]基于浅层语义分析的文本摘要方法研究与实现[D]. 李宝程.电子科技大学 2016
[5]基于深度学习与主题模型的问句相似度计算[D]. 周强.北京理工大学 2016
[6]智能问答系统的设计与实现[D]. 邢超.北京交通大学 2015
[7]自动问答系统的研究与应用[D]. 王肖磊.北京邮电大学 2015
[8]基于中文自然语言理解的问答系统研究[D]. 孙靖.西安建筑科技大学 2013



本文编号:3535240

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3535240.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户49088***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com