社保声纹认证的研究与实现
发布时间:2021-03-10 18:39
本文主要讲述的是基于深度学习的声纹识别在社保领域的应用。声纹是从语音中经过深度学习提取出来的个人声音纹理特征信息。社保声纹是从语音信息中提取出来应用于社保领域的声纹信息。声纹信息具有广泛的应用前景:监狱亲属远程探监身份确认、老年人社保身份确认。人脸识别容易受到光线强弱、梳妆打扮的影响。因此对声纹识别的研究具有重要的理论意义和实际应用价值。本文的主要工作内容有如下:首先对声纹识别在国内外的现状进行了研究,阐述了声纹识别相关的一些理论知识。其次对声纹识别的需求现状进行了阐述和分析并得出神经网络在社保方面具有广泛的应用前景。本文的研究主要针对于社保声纹领域。对社保声纹的应用做了需求分析。需求分析中主要讲述了声纹应用的客户需求、社保声纹应用的经济可行性、技术可行性、社保声纹应用的前景。本系统完成了语音信息的提取、预处理、训练和验证。声纹识别主要分为身份确认、可疑人信息辨认两个方面。在人员流动如此频繁的时代,经常会出现异地身份认证问题,声纹信息主要用于解决异地身份验证问题。同指纹认证相比,声纹认证的好处在于防止特征复制,解决远程认证困难。同人脸识别相比,声纹认证的优势在于纹理特征更加明显,防干扰...
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:93 页
【学位级别】:硕士
【部分图文】:
神经元示意图
第二章 深度学习的社保理论基础的响应程度。通过对上一层输入的多重运算把上一层的神经元转化为新的,从而对输入信息的处理方式进行了扩容。这个扩容的过程就是多重非线的映射。作为前馈神经网络与浅度学习相比最大的改进就是在于它的容量的扩充来的单层信息处理、多参数表示,改变为多层次网络处理,每一层之间由构成。由于是前馈神经网络的信息传播方向只能由前一层往后一层进行传向是从前往后具有单一性。在神经网络之中最少具有一个信息输入层和一结果输出层。一般的神经网络都具有多层隐藏信息层,隐藏信息层的主要是为了扩大信息容量以及增多信息处理的方式。下图 2-2 中展示了一个简单前馈神经网络模型结构。图中信号传递方向由左往右,每传播一层就会经处理,离我们想要的输出信号的距离就会更近,所以越往后需要的处理过越少[3]。如图 2-2 所示:
法、牛顿法、BP 算法 等等。度下降多的学习方法之中,梯度下降算法由于其简单易懂,方便快经网络的参数优化。梯度下降算法首先要做的就是求解目标后再使用迭代的方法使得梯度向量往局部极小值的方向学习式(2-2)所示:0 1 1 2 2( ) ...n nxh x x x 2-2)既可以是一元函数也可以是多元函数,既可以是线性函数也可以式可以转化为公式(2-3): 0ni iih x x Txθ 式(2-3)中的函数Txθ 是一个矩阵表达形式。在求解这个系着信息处理的最优解,损失函数可以被用来评估梯度下降的最。
【参考文献】:
期刊论文
[1]基于MFCC和双重GMM的鸟类识别方法[J]. 王恩泽,何东健. 计算机工程与设计. 2014(05)
[2]DNN与微软同声传译系统背后的故事[J]. 卢鸫翔. 程序员. 2013 (06)
[3]对MFCC进行GMM聚类的汉语数字识别方法[J]. 高文曦,于凤芹. 计算机系统应用. 2011(11)
本文编号:3075095
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:93 页
【学位级别】:硕士
【部分图文】:
神经元示意图
第二章 深度学习的社保理论基础的响应程度。通过对上一层输入的多重运算把上一层的神经元转化为新的,从而对输入信息的处理方式进行了扩容。这个扩容的过程就是多重非线的映射。作为前馈神经网络与浅度学习相比最大的改进就是在于它的容量的扩充来的单层信息处理、多参数表示,改变为多层次网络处理,每一层之间由构成。由于是前馈神经网络的信息传播方向只能由前一层往后一层进行传向是从前往后具有单一性。在神经网络之中最少具有一个信息输入层和一结果输出层。一般的神经网络都具有多层隐藏信息层,隐藏信息层的主要是为了扩大信息容量以及增多信息处理的方式。下图 2-2 中展示了一个简单前馈神经网络模型结构。图中信号传递方向由左往右,每传播一层就会经处理,离我们想要的输出信号的距离就会更近,所以越往后需要的处理过越少[3]。如图 2-2 所示:
法、牛顿法、BP 算法 等等。度下降多的学习方法之中,梯度下降算法由于其简单易懂,方便快经网络的参数优化。梯度下降算法首先要做的就是求解目标后再使用迭代的方法使得梯度向量往局部极小值的方向学习式(2-2)所示:0 1 1 2 2( ) ...n nxh x x x 2-2)既可以是一元函数也可以是多元函数,既可以是线性函数也可以式可以转化为公式(2-3): 0ni iih x x Txθ 式(2-3)中的函数Txθ 是一个矩阵表达形式。在求解这个系着信息处理的最优解,损失函数可以被用来评估梯度下降的最。
【参考文献】:
期刊论文
[1]基于MFCC和双重GMM的鸟类识别方法[J]. 王恩泽,何东健. 计算机工程与设计. 2014(05)
[2]DNN与微软同声传译系统背后的故事[J]. 卢鸫翔. 程序员. 2013 (06)
[3]对MFCC进行GMM聚类的汉语数字识别方法[J]. 高文曦,于凤芹. 计算机系统应用. 2011(11)
本文编号:3075095
本文链接:https://www.wllwen.com/shekelunwen/shehuibaozhanglunwen/3075095.html