变形欺骗性语音的检测算法研究及对其鲁棒的说话人识别系统实现
发布时间:2023-06-06 20:20
已有研究及实践均证明语音变形(Voice Transformation,VT)、语音转换(Voice Conversion,VC)、语音合成(Speech Synthesis,SS)及重播语音等欺骗性语音能有效地欺骗自动说话人识别系统,给社会安全带来严重的危害。目前已有的研究主要集中于对VC、SS及重播语音的检测,而对VT相关的安全问题研究相对不足。然而,相较实现成本较高且算法尚未完全成熟的VC及SS等操作,VT已有的算法能在改变说话人声音的同时高度保持语音的自然性,同时实现方式及成本便捷低廉,已集成在很多语音处理工具中,并在众多的案件中作为犯罪手段。因此,研究VT欺骗性语音的安全问题具有重要意义。为此,本文研究VT欺骗性语音的检测算法,并实现对VT欺骗鲁棒的说话人识别系统。本文主要的工作如下:1.提出一种基于高斯混合模型-通用背景模型超向量的VT语音检测算法。该算法利用MFCC在UBM下自适应得出的GMM-UBM超向量作为学习特征,并利用支持向量机作为分类方法。实验结果表明,该算法的识别率能达到98.62%。同时,当测试语音时长较短时,该算法能保持高识别率。2.利用Visual St...
【文章页数】:54 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 欺骗性语音安全问题研究的背景及意义
1.2 欺骗性语音安全问题的现状与发展
1.3 本文的文章结构
2 基础理论概述
2.1 语音预处理
2.2 端点检测
2.3 语音信号的频域分析
2.3.1 短时傅里叶变换
2.3.2 倒谱分析与同态滤波处理
2.3.3 梅尔频率倒谱系数
2.4 说话人识别模型
3 基于GMM-UBM超向量的VT欺骗性语音检测算法
3.1 语音变形(VT)原理
3.2 基于MFCC的两种特征提取
3.2.1 GMM超向量
3.2.2 MFCC统计矩特征
3.3 欺骗性语音VT的训练与检测
3.3.1 VT的量化分析
3.3.2 建立多SVM混合模型
3.3.3 VT检测算法
3.4 实验结果
3.4.1 实验设置
3.4.2 实验结果分析
4 VT欺骗鲁棒的说话人识别系统实现
4.1 系统的模块设计
4.1.1 开发环境
4.1.2 系统模块安排
4.2 特征提取模块
4.2.1 读入文件和预处理
4.2.2 特征提取功能
4.3 模型训练模块
4.3.1 GMM 训练功能
4.3.2 SVM训练功能
4.4 检测识别模块
4.4.1 检测功能
4.4.2 说话人识别功能
5 总结与展望
参考文献
致谢
攻读硕士学位期间的学术成果
学位论文数据集表
本文编号:3832159
【文章页数】:54 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 欺骗性语音安全问题研究的背景及意义
1.2 欺骗性语音安全问题的现状与发展
1.3 本文的文章结构
2 基础理论概述
2.1 语音预处理
2.2 端点检测
2.3 语音信号的频域分析
2.3.1 短时傅里叶变换
2.3.2 倒谱分析与同态滤波处理
2.3.3 梅尔频率倒谱系数
2.4 说话人识别模型
3 基于GMM-UBM超向量的VT欺骗性语音检测算法
3.1 语音变形(VT)原理
3.2 基于MFCC的两种特征提取
3.2.1 GMM超向量
3.2.2 MFCC统计矩特征
3.3 欺骗性语音VT的训练与检测
3.3.1 VT的量化分析
3.3.2 建立多SVM混合模型
3.3.3 VT检测算法
3.4 实验结果
3.4.1 实验设置
3.4.2 实验结果分析
4 VT欺骗鲁棒的说话人识别系统实现
4.1 系统的模块设计
4.1.1 开发环境
4.1.2 系统模块安排
4.2 特征提取模块
4.2.1 读入文件和预处理
4.2.2 特征提取功能
4.3 模型训练模块
4.3.1 GMM 训练功能
4.3.2 SVM训练功能
4.4 检测识别模块
4.4.1 检测功能
4.4.2 说话人识别功能
5 总结与展望
参考文献
致谢
攻读硕士学位期间的学术成果
学位论文数据集表
本文编号:3832159
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3832159.html