基于语音处理的说话人身份识别研究
发布时间:2021-07-05 13:17
随着科技的发展,基于生物特征的人脸、虹膜、瞳孔、指纹以及声纹识别不断发展并取得了重大进展。由于语音数据采集方便、简单、成本低且难以模仿,基于说话人语音信号特征从而实现说话人身份识别的新技术不断涌现,使说话人识别技术的应用越来越多,如公安司法查证、银行交易系统、手机智能支付和声控门等。最近新冠疫情席卷全球,人们纷纷响应专家建议佩戴口罩以防止感染,但是却让以人脸识别来进行身份识别的系统陷入困境;此时说话人识别的优势则得以凸显,因此开展基于语音处理的说话人识别研究具有重要理论价值和实用意义。基于传统特征参数提取和模式匹配的说话人识别存在着太多人为因素,且在数据量增多时模型无法拟合说话人特性。论文开展了利用卷积神经网络算法对增强的语谱图进行训练学习和识别的说话人识别方法研究,主要工作如下:(1)介绍了说话人识别的研究意义,概述了其发展现状,阐述了常用的语音特征提取算法和传统的说话人识别模型,讨论了不同说话人识别模型的优缺点。(2)分析讨论了不同神经网络结构的说话人识别算法。介绍了人工神经网络的原理,讨论了基于深度神经网络、延时神经网络以及卷积神经网络结构的说话人识别,同时讨论了不同激活函数和防...
【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
图2.1两种窗函数特性图??图2.1为两种窗函数特性图,由图可知,汉明窗具有更平滑的低通特性,可防??止语音出现截断,获得较为平滑的能量函数
Neural?Network,??TDNN)以及卷积神经网络模型(Convolutional?Neural?Network,CNN)?[42][43][44]。??人工神经网络(Artificial?Neural?Network,?ANN)是一个通过模仿人脑处理数据??的功能来分析和处理数据的数学模型。ANN具有多层网络结构且多个神经元与节??点相结合来处理信息。下图为单个神经元模型图:??\??X2?\?\??私—分个-一;??\?—?/?/??+1?????图3.1单个神经元模型示意图??17??
:??Hw,b{^)?=?f{wTx)?=?f{iwiXi+b^?(3.1)??由上式可知,在没有激活函数时,每层神经网络的输出可由其输入数据线性组??合得到,不论网络层数有几层,输出都可由输入数据线性组合得到,但这种网络结??构拟合效果较差。在网络中加入激活函数,即向网络中增加非线性元素,使网络模??型变为一个非线性模型,这可以增加网络学习能力和拟合能力。接下来将分析三种??常见的激活函数:Sigmoid函数,Tanh函数和ReLU函数。??1.?Sigmoid?函数??在生物学中Sigmoid函数是一种通用的S型函数,在神经网络中被作为阈值函??数使用。其数学表达式和几何图形为:??
【参考文献】:
期刊论文
[1]深度学习框架下说话人识别研究综述[J]. 曾春艳,马超峰,王志锋,朱栋梁,赵楠,王娟,刘聪. 计算机工程与应用. 2020(07)
[2]改进的Dropout正则化卷积神经网络[J]. 满凤环,陈秀宏,何佳佳. 传感器与微系统. 2018(04)
[3]卷积神经网络研究综述[J]. 周飞燕,金林鹏,董军. 计算机学报. 2017(06)
[4]基于DTW模型补偿的伪装语音说话人识别研究[J]. 李燕萍,陶定元,林乐. 计算机技术与发展. 2017(01)
[5]基于改进的卷积神经网络的中文情感分类[J]. 张绮琦,张树群,雷兆宜. 计算机工程与应用. 2017(22)
[6]基于CNN的录音设备判别研究[J]. 高冲红,丛韫,郑义,侍孝一,童茜雯,徐欣铖. 信息化研究. 2016(02)
[7]基于卷积神经网络分类的说话人识别算法[J]. 胡青,刘本永. 信息网络安全. 2016(04)
[8]声纹识别技术及其应用现状[J]. 郑方,李蓝天,张慧,艾斯卡尔·肉孜. 信息安全研究. 2016(01)
[9]基于归一化自相关的语音基频特征提取[J]. 曹梦霞,郑永果,郑尚新. 信息技术与信息化. 2014(02)
[10]声纹识别技术及其应用前景分析[J]. 陈拥权,张羽,胡翀豪,楚瑾. 网络安全技术与应用. 2013(11)
硕士论文
[1]基于深度特征的说话人辨认技术研究[D]. 顾婷.南京邮电大学 2019
[2]面向说话人识别的深度学习方法研究[D]. 樊云云.南昌航空大学 2019
[3]基于神经网络的声纹识别研究[D]. 邱子璇.电子科技大学 2019
[4]基于深度学习的说话人识别系统[D]. 张竞丹.西安邮电大学 2018
[5]基于聚类算法的个性化新闻推荐技术研究与实现[D]. 杨如冰.北京邮电大学 2017
[6]基于GMM的说话人识别系统研究与实现[D]. 陈强.武汉理工大学 2010
本文编号:3266139
【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
图2.1两种窗函数特性图??图2.1为两种窗函数特性图,由图可知,汉明窗具有更平滑的低通特性,可防??止语音出现截断,获得较为平滑的能量函数
Neural?Network,??TDNN)以及卷积神经网络模型(Convolutional?Neural?Network,CNN)?[42][43][44]。??人工神经网络(Artificial?Neural?Network,?ANN)是一个通过模仿人脑处理数据??的功能来分析和处理数据的数学模型。ANN具有多层网络结构且多个神经元与节??点相结合来处理信息。下图为单个神经元模型图:??\??X2?\?\??私—分个-一;??\?—?/?/??+1?????图3.1单个神经元模型示意图??17??
:??Hw,b{^)?=?f{wTx)?=?f{iwiXi+b^?(3.1)??由上式可知,在没有激活函数时,每层神经网络的输出可由其输入数据线性组??合得到,不论网络层数有几层,输出都可由输入数据线性组合得到,但这种网络结??构拟合效果较差。在网络中加入激活函数,即向网络中增加非线性元素,使网络模??型变为一个非线性模型,这可以增加网络学习能力和拟合能力。接下来将分析三种??常见的激活函数:Sigmoid函数,Tanh函数和ReLU函数。??1.?Sigmoid?函数??在生物学中Sigmoid函数是一种通用的S型函数,在神经网络中被作为阈值函??数使用。其数学表达式和几何图形为:??
【参考文献】:
期刊论文
[1]深度学习框架下说话人识别研究综述[J]. 曾春艳,马超峰,王志锋,朱栋梁,赵楠,王娟,刘聪. 计算机工程与应用. 2020(07)
[2]改进的Dropout正则化卷积神经网络[J]. 满凤环,陈秀宏,何佳佳. 传感器与微系统. 2018(04)
[3]卷积神经网络研究综述[J]. 周飞燕,金林鹏,董军. 计算机学报. 2017(06)
[4]基于DTW模型补偿的伪装语音说话人识别研究[J]. 李燕萍,陶定元,林乐. 计算机技术与发展. 2017(01)
[5]基于改进的卷积神经网络的中文情感分类[J]. 张绮琦,张树群,雷兆宜. 计算机工程与应用. 2017(22)
[6]基于CNN的录音设备判别研究[J]. 高冲红,丛韫,郑义,侍孝一,童茜雯,徐欣铖. 信息化研究. 2016(02)
[7]基于卷积神经网络分类的说话人识别算法[J]. 胡青,刘本永. 信息网络安全. 2016(04)
[8]声纹识别技术及其应用现状[J]. 郑方,李蓝天,张慧,艾斯卡尔·肉孜. 信息安全研究. 2016(01)
[9]基于归一化自相关的语音基频特征提取[J]. 曹梦霞,郑永果,郑尚新. 信息技术与信息化. 2014(02)
[10]声纹识别技术及其应用前景分析[J]. 陈拥权,张羽,胡翀豪,楚瑾. 网络安全技术与应用. 2013(11)
硕士论文
[1]基于深度特征的说话人辨认技术研究[D]. 顾婷.南京邮电大学 2019
[2]面向说话人识别的深度学习方法研究[D]. 樊云云.南昌航空大学 2019
[3]基于神经网络的声纹识别研究[D]. 邱子璇.电子科技大学 2019
[4]基于深度学习的说话人识别系统[D]. 张竞丹.西安邮电大学 2018
[5]基于聚类算法的个性化新闻推荐技术研究与实现[D]. 杨如冰.北京邮电大学 2017
[6]基于GMM的说话人识别系统研究与实现[D]. 陈强.武汉理工大学 2010
本文编号:3266139
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3266139.html