当前位置:主页 > 科技论文 > 自动化论文 >

面向重放攻击检测的网络嵌入特征提取方法研究

发布时间:2020-12-12 01:14
  自动说话人验证(Automatic Speaker Verification,ASV)旨在验证说话人所声称的身份是否真实,是目前广泛应用的生物识别技术之一,与指纹、人脸等生物识别技术相比,具有非接触、无需光照等优点。然而,随着应用系统对说话人验证技术依赖程度和信任度的提高,如何防范可能面临的各种攻击,是ASV应用系统必须解决的一个重要而困难的问题。重放攻击是指通过重放窃取/录制的目标说话人语音来冒充目标说话人,是一种常见的说话人验证系统攻击手段。而传统的ASV技术很难辨别这种攻击。因此,需要研究专门的技术手段来检测这种攻击。本文针对说话人重放攻击检测问题,着重研究有效的特征提取方法,以期达到有效检测重放攻击的目标。论文主要工作内容如下:1)提出了一种基于时延神经网络(Time Delay Neural Network,TDNN)的嵌入特征提取方法。采用TDNN网络提取嵌入特征,使用聚焦损失函数解决训练数据中数据失衡问题,并用softmax进行最终的攻击检测分类。与传统的基于逆梅尔倒谱系数(Inverted Mel Frequency Cepstral Coefficient,IMFCC... 

【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校

【文章页数】:58 页

【学位级别】:硕士

【部分图文】:

面向重放攻击检测的网络嵌入特征提取方法研究


重放攻击过程

过程图,特征提取,过程,信号


哈尔滨工业大学工程硕士学位论文-10-号(),如公式(2-2)所示:()=()=()/2+g(t)(2-2)式中g(t)与()是同频的高斯白噪声。从公式(2-1)和(2-2)可以看出,解调信号()在通过低通滤波器的时候,重放语音信号()高频部分的信号()cos(2)/2被滤掉,造成()在高频部分的损失,因此,在高频部分的频谱子频带中,真实语音信号和重放语音信号有着显著的区别。所以本文在重放攻击检测任务中选择能突出高频成分特点的逆梅尔倒谱系数(InvertedMelFrequencyCepstralCoefficient,IMFCC)作为基线系统与后续实验网络的音频特征输入。IMFCC特征提取过程如图2-3所示。首先,将语音信号()进行预加重来提升高频部分,得到处理后的语音信号()。其次,使用分帧和加窗操作让语音信号()从非平稳信号转换为短时稳态信号()。然后,对分帧并加窗后的各帧信号()进行快速傅里叶变换(FastFourierTransform,FFT)处理得到各帧的频谱信号()。再计算各帧的能量谱得到|()|2,并用逆梅尔滤波器对能量谱进行能量谱滤波,得到逆梅尔滤波能量谱()。最后对各个滤波器组输出的对数能量进行计算,使用离散余弦变换DCT计算IMFCC系数。图2-3IMFCC特征提取过程IMFFCC特征的各计算步骤如下:(1)预加重语音信号频率越高,信号成分越少,通过预加重可以加强其高频部分,并降低口腔对语音信号的影响。音频信号()为离散信号,预加重处理后得到的信号(),如公式(2-3)所示:()=()(1)(2-3)式中α——预加重系数,0≤α≤1,()——输入音频数据,y()——预加重输出。

流程图,算法,步骤,问题


哈尔滨工业大学工程硕士学位论文-15-函数。Jensen不等式定义如下:如果g(x)是RX上的凸函数,并且[()]和[()]是有限的,那么:[()]≥([])。公式中当且仅当X的类型是常量,等号成立。另外,E(X)的符号代表X的数学期望值。(3)EM算法:EM算法要解决的问题如图2-4所示:图2-4EM算法要解决的问题EM算法求解步骤如图2-5所示:图2-5EM算法求解步骤流程图(4)EM算法推导流程:对于n个可观测数据样本=(1,2,…,),要找出样本的模型参数,此时若之前获得的观测数据没有未观测到的隐含变量z=(z_1,z_2,…,z_n),则它的最大化似然模型分布的对数似然函数如公式(2-20)所示:


本文编号:2911574

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2911574.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户10500***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com