基于张量结构的说话人证实技术研究
发布时间:2023-11-04 15:11
说话人证实技术是语音信号处理领域中的重要研究方向,也是生物认证技术的重要手段。其主要任务是以提取目标说话人的训练语音和测试语音的声学特征为基础,建立说话人模型,通过比较二者达到识别验证目的。提高声学特征鲁棒性,保障系统的识别性能是说话人证实技术的研究重点。针对传统声学特征易受噪声环境影响的问题,本文提出一种基于张量结构的改进的MFCC特征参数提取方法。该方法把不同说话人的对数滤波器组能量构成一个三阶张量,利用加了非负约束条件的张量PCA分析获得投影矩阵,将对数滤波器组能量在DCT变换之前进行投影,从而得到改进的语音特征参数T-MFCC。实验结果表明,与传统MFCC相比,在低信噪比的条件下,T-MFCC并没有像MFCC一样出现明显衰减现象,而是保留了比较清晰的特征信息。并且在同等噪声环境下,相较于其他方法,基于T-MFCC的说话人证实系统具有更低的等错误率。这是由于张量的PCA方法在完成降维和去噪任务的同时,能够更好地保留原始语音数据关于不同说话人之间的内在联系信息。一般的建模方法容易造成有用信息的丢失,而张量结构的模型不仅可以很好地保留不同说话人之间的内在关联,还能挖掘出同一说话人不同...
【文章页数】:58 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 说话人识别的基本概念
1.2 说话人识别的意义和应用
1.3 国内外研究的发展及现状
1.4 本文的研究内容
1.5 论文结构安排
第2章 说话人证实系统
2.1 引言
2.2 语音的产生原理
2.3 说话人证实的基本原理
2.4 说话人证实常见的特征参数
2.4.1 LPC系数及其派生系数
2.4.2 MFCC系数
2.4.3 语谱图
2.5 说话人证实常用建模方法
2.5.1 GMM模型
2.5.2 GMM-UBM模型
2.5.3 JFA模型
2.5.4 I-vector模型
2.6 评价标准
2.7 本章小结
第3章 基于T-MFCC特征的说话人证实系统
3.1 引言
3.2 张量的基本概念与计算
3.3 张量结构的主成分分析
3.4 T-MFCC特征提取
3.5 实验过程及结果
3.5.1 实验数据准备
3.5.2 实验参数选择
3.5.3 特征抗噪性能比较
3.5.4 不同特征认证系统性能比较
3.6 本章小结
第4章 非负张量分解模型的说话人证实
4.1 引言
4.2 CP分解和Tucker分解
4.2.1 CP分解
4.2.2 Tucker分解
4.3 非负张量分解
4.4 基于张量模型的说话人识别系统
4.4.1 特征提取
4.4.2 说话人建模
4.5 实验过程及结果
4.5.1 实验特征的比较
4.5.2 说话人模型的比较
4.6 本章小结
第5章 总结与展望
5.1 全文总结
5.2 未来展望
致谢
参考文献
附录
本文编号:3860547
【文章页数】:58 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 说话人识别的基本概念
1.2 说话人识别的意义和应用
1.3 国内外研究的发展及现状
1.4 本文的研究内容
1.5 论文结构安排
第2章 说话人证实系统
2.1 引言
2.2 语音的产生原理
2.3 说话人证实的基本原理
2.4 说话人证实常见的特征参数
2.4.1 LPC系数及其派生系数
2.4.2 MFCC系数
2.4.3 语谱图
2.5 说话人证实常用建模方法
2.5.1 GMM模型
2.5.2 GMM-UBM模型
2.5.3 JFA模型
2.5.4 I-vector模型
2.6 评价标准
2.7 本章小结
第3章 基于T-MFCC特征的说话人证实系统
3.1 引言
3.2 张量的基本概念与计算
3.3 张量结构的主成分分析
3.4 T-MFCC特征提取
3.5 实验过程及结果
3.5.1 实验数据准备
3.5.2 实验参数选择
3.5.3 特征抗噪性能比较
3.5.4 不同特征认证系统性能比较
3.6 本章小结
第4章 非负张量分解模型的说话人证实
4.1 引言
4.2 CP分解和Tucker分解
4.2.1 CP分解
4.2.2 Tucker分解
4.3 非负张量分解
4.4 基于张量模型的说话人识别系统
4.4.1 特征提取
4.4.2 说话人建模
4.5 实验过程及结果
4.5.1 实验特征的比较
4.5.2 说话人模型的比较
4.6 本章小结
第5章 总结与展望
5.1 全文总结
5.2 未来展望
致谢
参考文献
附录
本文编号:3860547
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3860547.html