当前位置:主页 > 科技论文 > 网络通信论文 >

基于信号稀疏分解的复杂环境下说话人识别研究

发布时间:2017-10-01 18:34

  本文关键词:基于信号稀疏分解的复杂环境下说话人识别研究


  更多相关文章: 稀疏分解 说话人识别 语音去噪 离散余弦基 时频字典


【摘要】:说话人识别技术是利用语音所包含的说话人特有的个性特征,自动进行身份认证的过程,因其具备经济性、非接触性、普适性和可区分性等天然优势在众多生物认证技术中独树一帜。现有的说话人识别技术在理想环境下识别效果良好,但在实际应用中,复杂环境使得训练和识别语音特征失配,系统识别性能急剧下降。如何有效提高识别系统的鲁棒性成为该技术的重点和难点。稀疏分解作为信号处理领域一个重要的理论分支,被广泛应用于信号去噪、压缩编码、参数估计、信号时频分析和盲源分离等诸多方面。本文基于信号的稀疏分解理论,研究不同噪声背景下语音信号的去噪问题,给出相应的语音信号去噪方法;同时将基于稀疏分解的去噪方法用于说话人识别系统的预处理环节,分析其对系统识别性能的影响。本文主要工作如下:1.搭建基于矢量量化的说话人识别系统。首先简要介绍系统的构成;然后,根据系统实现的具体步骤对系统各部分逐一介绍,对其中关键步骤——特征提取和模板训练与识别进行了详细的分析;最后,通过仿真实验,调试出系统达到最佳识别率时的各项参数。2.研究稀疏分解理论在语音信号去噪中的应用。给出信号的稀疏表示和信号重构算法,并重点介绍了一种与本文密切相关的凸松弛重构算法——基追踪算法;同时,对语音信号在不同基底上稀疏分解,选定稀疏度最佳的DCT基作为本文的稀疏表示基,并将基于DCT的稀疏分解应用于语音信号的去噪处理中,仿真实验表明,在低信噪比时,基于稀疏分解的去噪方法可以有效提高重构语音信号的帧平均信噪比。3.分析不同噪声背景下,基于稀疏分解的语音去噪方法对说话人识别系统性能的影响。说话人识别系统预处理环节中使用的去噪方法由噪声方差的有界性决定。对于方差有界的两种典型宽带噪声——均匀噪声和高斯噪声,采用基于DCT稀疏分解的去噪方法;对于方差无界的对称α稳定分布冲击噪声,采用基于联合时频字典稀疏分解的去噪方法。仿真实验表明,这两种方法在低信噪比/广义信噪比时,可显著提高说话人识别系统的识别率。
【关键词】:稀疏分解 说话人识别 语音去噪 离散余弦基 时频字典
【学位授予单位】:南京理工大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.34
【目录】:
  • 摘要3-4
  • Abstract4-8
  • 1 绪论8-14
  • 1.1 课题研究的背景和意义8-9
  • 1.2 国内外课题研究现状9-12
  • 1.2.1 说话人识别发展历史及现状9-10
  • 1.2.2 信号稀疏分解发展历史及现状10-12
  • 1.3 本文的主要内容和章节安排12-14
  • 2 基于矢量量化的说话人识别系统14-27
  • 2.1 系统的基本结构14-15
  • 2.2 说话人系统的实现15-24
  • 2.2.1 语音信号的预处理15-18
  • 2.2.2 说话人识别特征参数提取18-21
  • 2.2.3 说话人识别的模型训练及匹配21-24
  • 2.3 基于VQ的说话人识别系统的构建与测试24-26
  • 2.3.1 不同码本容量对识别结果的影响24-25
  • 2.3.2 不同失真度量方法对识别结果的影响25
  • 2.3.3 不同初始码本方法对识别结果的影响25-26
  • 2.4 本章小结26-27
  • 3 语音信号的稀疏分解与去噪27-41
  • 3.1 信号稀疏分解基本原理27-32
  • 3.1.1 信号的稀疏分解27-29
  • 3.1.2 稀疏信号的重构29-30
  • 3.1.3 仿真分析30-32
  • 3.2 语音信号的稀疏性分析32-36
  • 3.2.1 语音信号在离散余弦基下的稀疏性32-34
  • 3.2.2 语音信号在离散傅里叶基下的稀疏性34-36
  • 3.3 基于稀疏分解的语音信号去噪36-39
  • 3.3.1 基于稀疏分解的信号去噪基本思想36-37
  • 3.3.2 仿真分析37-39
  • 3.4 本章小结39-41
  • 4 基于稀疏分解的含噪语音说话人识别研究41-56
  • 4.1 宽带噪声下含噪语音说话人识别41-47
  • 4.1.1 均匀噪声和高斯噪声模型41-43
  • 4.1.2 均匀噪声下说话人识别实验仿真43-45
  • 4.1.3 高斯噪声下说话人识别实验仿真45-47
  • 4.2 冲击噪声下含噪语音说话人识别47-55
  • 4.2.1 α稳定分布模型48-49
  • 4.2.2 基于联合时频字典稀疏分解的语音信号去噪49-53
  • 4.2.3 冲击噪声下的说话人识别性能仿真53-55
  • 4.3 本章小结55-56
  • 5 总结56-57
  • 致谢57-58
  • 参考文献58-62
  • 附录62-65

【共引文献】

中国期刊全文数据库 前10条

1 白燕燕;胡晓霞;郑三婷;;基于听觉特性的声纹识别系统的研究[J];电子设计工程;2015年04期

2 赵玉晓;顾秀秀;张二华;;与文本无关说话人识别[J];计算机与数字工程;2014年02期

3 赵立辉;毛竹;霍春宝;杨红U,

本文编号:955014


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/955014.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0ad85***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com