基于深度学习的句子相似度计算方法研究

发布时间:2024-07-08 18:56
  随着计算机的普及,人们习惯于使用互联网来获取所需要的信息,但是由于数字信息是以指数形式逐年递增。人们在使用搜索引擎时,搜索引擎只能返回相关信息的链接或者包含答案内容的大段文本资料,用户想要获取有用的信息还要进行二次筛选,搜索引擎已经无法满足大多数人的需求。但问答系统反馈给用户的答案不是一大堆相关的文档或者是相关的链接,而是更加精确的答案,这样更加符合用户的需求。问答系统的关键技术就是问句相似度处理,传统的相似度研究方法无法有效捕获句子的语义信息,而且匹配的准确度不高。深度学习中的卷积神经网络可以对句子特征进行有效提取,循环神经网络可以捕获句子的上下文信息,两种方法都可以很好的捕获句子的语义信息,并且使用深度学习的句子相似度准确度更高。本文对深度学习中卷积神经网络(CNN)和循环神经网络(RNN)在文本处理上的优缺点做了对比。结合深度学习的相关知识着重研究了深度匹配语义模型,并对基于卷积神经网络的语义匹配模型展开研究,在池化层使用k-max均值采样,提出了基于k-max均值采样技术的句子相似度算法,通过与原模型进行实验对比,得出本文所用方法的精确度更高。在实验研究的过程中发现该方式存在无...

【文章页数】:55 页

【学位级别】:硕士

【部分图文】:

图2.1二维空间余弦距离

图2.1二维空间余弦距离

被称为欧氏距离),指在m维空间中两个的距离。假设x,y是空间中的两个点,2(,)()iidistxyxyx,y的坐标值。当使用欧氏距离表示相1(,)1(,)distxysimxy向量的常用方法[36],主要是通过计算两向量之间的相似度,当余弦值越接近1....


图2.3神经元其中、、……、是输入项,、、……、代表权重,为偏置项,f(z)为

图2.3神经元其中、、……、是输入项,、、……、代表权重,为偏置项,f(z)为

图2.3神经元、、……、是输入项,、、……、代表权重,为偏置神经元输出如式(2.5)。(......)11220yfwxwxwxwnn所有的神经元连接组合在一起便是一个神经网络。神经网络纪60年代,Hubei等人在研究视觉皮层时,发现视觉信息从视网多....


图2.4池化操作中的最大池化和平均池化

图2.4池化操作中的最大池化和平均池化

并且成功证明了神经网络深度的提升也对提升分类络的核心思想是局部感知与权值共享,典型的卷积神经网络池化层、全连接层和输出层五部分组成。作比较简单,就是对原始的数据进行预处理,并将处理好的积神经网络中最关键的一层,卷积层的运行原理就是将输入的神经元相连。积层提取到不同的特征之后进入池....


图2.5循环神经网络结构图

图2.5循环神经网络结构图

即隐藏层的输入不仅包含当前的输入内容还包含上一层隐藏层的内容,循环神经网络如图2.5。图2.5循环神经网络结构图算式(2.6)是输出层的计算公式,输出层是一个全连接层,意味着它的每个节点与隐藏层的每个节点都是相互连接的,输出层的权重矩阵用V表示,激活函数用g表示。算式....



本文编号:4003726

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/4003726.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户be649***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com