基于EMD的说话人特征参数提取方法研究
发布时间:2017-10-05 18:44
本文关键词:基于EMD的说话人特征参数提取方法研究
更多相关文章: 说话人识别 经验模态分解(EMD) 特征提取 Wigner-Ville谱 FFT
【摘要】:随着科学技术的不断发展,如何利用机器来识别出不同的人,逐渐被人们所重视。说话人识别研究的是如何将人的语音作为身份标志,让机器依据这个标志辨识出不同的人。作为一种能为人们的日常生活提供便利的技术,说话人识别技术成为人们研究的热点。在说话人识别技术中,研究的核心是能够表征说话人的特征参数,提取了表征性能好的的说话人特征参数,才能准确的识别说话人。美尔频率倒谱系数(MFCC)是基于人耳听觉特性的一种参数,是描述说话人的重要特征参数之一。经验模态分解(EMD)是一种适合于语音信号处理的方法。我们将EMD应用到说话人识别中,可得到一些有意义的结果。本文详细的研究了说话人识别的特征参数的提取方法,分析了目前特征参数提取法的研究现状,主要作了以下工作:(1)MFCC提取法中利用FFT将语音信号从时域转换到频域,但FFT不能反映信号的瞬时变化情况。针对这种情况,本文对这一步骤进行了改进。Wigner-Ville分布是信号能量随时间-频率的分布,它能精确的定位信号的时频结构,但多分量信号的Wigner-Ville分布受困于交叉项的干扰。因此利用Wigner-Ville分布的优点,采用Wigner-Ville谱与FFT结合来代替单独的FFT,进行MFCC参数提取。提出了一种基于时频分析的MFCC参数提取法。通过实验仿真,验证了本方法既抑制了交叉项的干扰,又得到了精准的时频结构。本方法与传统的MFCC提取法相比,说话人识别的正确率有所提高。(2)根据语音信号的非平稳特点,提出了一种基于经验模态分解的语音特征参数提取法。首先利用短时时域处理技术对语音进行去清音处理,再用经验模态分解方法把语音信号分解为一系列固有模态函数(IMF)。一个IMF只含有语音信号的一部分信息,不同IMF分量携带的特征信息不同,对这些IMFs进行加权处理,综合得到新的语音,再对其进行后续处理。这样做的目的是为了突出有效的说话人特征信息,而筛掉一些无用的、不能表征说话人特征的信息。实验表明,该方法比传统的参数提取法更有效。(3)综合前述方法,提出了一种基于EMD与时频分析相结合的提取方法,即先将语音进行EMD分解,对得到的IMF进行加权,然后用FFT与Wigner分布相结合的方法进行MFCC参数提取。运用到说话人识别系统后,实验结果表明,相较于前述的两种方法,该方法大大提高了说话人识别系统的正确率,且鲁棒性较好。(4)ASCC描述的是信号的中频段信息,运用EMD方法和Hilbert变换,将语音信号的中频段(1500Hz-2500Hz)筛选出来,进行ASCC参数提取。然后与MFCC参数组合,提出一种基于Hilbert-Huang变换的MFCC与ASCC的混合参数提取法。实验表明,混合参数较传统的MFCC参数应用于说话人识别系统,正确率有一定提升。
【关键词】:说话人识别 经验模态分解(EMD) 特征提取 Wigner-Ville谱 FFT
【学位授予单位】:湘潭大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.34
【目录】:
- 摘要4-5
- Abstract5-9
- 第1章 绪论9-15
- 1.1 研究背景9
- 1.2 基本原理与研究意义9-11
- 1.2.1 说话人识别的基本原理9-11
- 1.2.2 说话人识别的意义及应用11
- 1.3 特征参数11-12
- 1.4 EMD方法12-13
- 1.4.1 概述12
- 1.4.2 研究现状12-13
- 1.5 本文的主要研究内容和章节安排13-15
- 1.5.1 主要研究内容13
- 1.5.2 文章安排13-15
- 第2章 语音信号的处理方法15-26
- 2.1 引言15
- 2.2 时域处理15-21
- 2.2.1 短时平均能量和短时平均幅度15-17
- 2.2.2 短时过零分析17-19
- 2.2.3 短时自相关和平均幅度差函数19-21
- 2.3 时频处理21-23
- 2.3.1 短时傅里叶变换21-22
- 2.3.2 Wigner分布22-23
- 2.4 同态处理23-25
- 2.4.1 复倒谱和倒谱24
- 2.4.2 倒谱分析与同态解卷积24-25
- 2.5 本章小结25-26
- 第3章 说话人特征参数的算法及其实现26-33
- 3.1 引言26
- 3.2 说话人特征参数26-29
- 3.2.1 MFCC参数26-28
- 3.2.2 ASCC参数28-29
- 3.2.3 实验仿真结果与分析29
- 3.3 基于时频处理的MFCC参数提取29-31
- 3.3.1 基于Wigner分布与DFT相结合的时频分析方法29-30
- 3.3.2 基于时频分析的MFCC参数提取过程30-31
- 3.4 实验仿真与结果分析31-32
- 3.5 本章小结32-33
- 第4章 基于EMD的语音信号分解33-41
- 4.1 引言33
- 4.2 EMD分解33-37
- 4.2.1 EMD分解原理及分解的过程33-35
- 4.2.2 固有模态函数35-37
- 4.2.3 EMD端点效应37
- 4.3 Hilbert变换37-40
- 4.3.1 瞬时频率37-39
- 4.3.2 Hilbert谱与边际谱39-40
- 4.4 本章小结40-41
- 第5章 基于EMD结合时频分析的特征参数提取法41-50
- 5.1 引言41
- 5.2 基于EMD加权的原理41-44
- 5.2.1 IMF幅值和频率信息42-43
- 5.2.2 权重的选择43-44
- 5.3 基于EMD加权MFCC参数提取44-46
- 5.3.1 语音信号的去清音处理44-45
- 5.3.2 基于EMD结合时频分析的特征提取流程图45-46
- 5.4 基于EMD的MFCC与ASCC混合参数的提取46
- 5.5 实验仿真与结果分析46-48
- 5.6 本章小结48-50
- 第6章 总结与展望50-52
- 6.1 工作总结50-51
- 6.2 展望51-52
- 参考文献52-56
- 致谢56-57
- 附录A 个人简历、在校期间发表学术论文与研究成果57-58
- 附录B 论文中的用图58-60
- 附录C 论文中的用表60
【参考文献】
中国期刊全文数据库 前1条
1 李天云,赵妍,李楠;基于EMD的Hilbert变换应用于暂态信号分析[J];电力系统自动化;2005年04期
中国硕士学位论文全文数据库 前1条
1 王京辉;语音信号处理技术研究[D];山东大学;2008年
,本文编号:978195
本文链接:https://www.wllwen.com/kejilunwen/wltx/978195.html