基于EMD的说话人特征参数提取方法研究

发布时间：2017-10-05 18:44

本文关键词：基于EMD的说话人特征参数提取方法研究

【摘要】：随着科学技术的不断发展,如何利用机器来识别出不同的人,逐渐被人们所重视。说话人识别研究的是如何将人的语音作为身份标志,让机器依据这个标志辨识出不同的人。作为一种能为人们的日常生活提供便利的技术,说话人识别技术成为人们研究的热点。在说话人识别技术中,研究的核心是能够表征说话人的特征参数,提取了表征性能好的的说话人特征参数,才能准确的识别说话人。美尔频率倒谱系数(MFCC)是基于人耳听觉特性的一种参数,是描述说话人的重要特征参数之一。经验模态分解(EMD)是一种适合于语音信号处理的方法。我们将EMD应用到说话人识别中,可得到一些有意义的结果。本文详细的研究了说话人识别的特征参数的提取方法,分析了目前特征参数提取法的研究现状,主要作了以下工作:(1)MFCC提取法中利用FFT将语音信号从时域转换到频域,但FFT不能反映信号的瞬时变化情况。针对这种情况,本文对这一步骤进行了改进。Wigner-Ville分布是信号能量随时间-频率的分布,它能精确的定位信号的时频结构,但多分量信号的Wigner-Ville分布受困于交叉项的干扰。因此利用Wigner-Ville分布的优点,采用Wigner-Ville谱与FFT结合来代替单独的FFT,进行MFCC参数提取。提出了一种基于时频分析的MFCC参数提取法。通过实验仿真,验证了本方法既抑制了交叉项的干扰,又得到了精准的时频结构。本方法与传统的MFCC提取法相比,说话人识别的正确率有所提高。(2)根据语音信号的非平稳特点,提出了一种基于经验模态分解的语音特征参数提取法。首先利用短时时域处理技术对语音进行去清音处理,再用经验模态分解方法把语音信号分解为一系列固有模态函数(IMF)。一个IMF只含有语音信号的一部分信息,不同IMF分量携带的特征信息不同,对这些IMFs进行加权处理,综合得到新的语音,再对其进行后续处理。这样做的目的是为了突出有效的说话人特征信息,而筛掉一些无用的、不能表征说话人特征的信息。实验表明,该方法比传统的参数提取法更有效。(3)综合前述方法,提出了一种基于EMD与时频分析相结合的提取方法,即先将语音进行EMD分解,对得到的IMF进行加权,然后用FFT与Wigner分布相结合的方法进行MFCC参数提取。运用到说话人识别系统后,实验结果表明,相较于前述的两种方法,该方法大大提高了说话人识别系统的正确率,且鲁棒性较好。(4)ASCC描述的是信号的中频段信息,运用EMD方法和Hilbert变换,将语音信号的中频段(1500Hz-2500Hz)筛选出来,进行ASCC参数提取。然后与MFCC参数组合,提出一种基于Hilbert-Huang变换的MFCC与ASCC的混合参数提取法。实验表明,混合参数较传统的MFCC参数应用于说话人识别系统,正确率有一定提升。
【关键词】：说话人识别 经验模态分解(EMD) 特征提取 Wigner-Ville谱 FFT
【学位授予单位】：湘潭大学
【学位级别】：硕士
【学位授予年份】：2015
【分类号】：TN912.34
【目录】：

摘要4-5
Abstract5-9
第1章绪论9-15
1.1 研究背景9
1.2 基本原理与研究意义9-11
1.2.1 说话人识别的基本原理9-11
1.2.2 说话人识别的意义及应用11
1.3 特征参数11-12
1.4 EMD方法12-13
1.4.1 概述12
1.4.2 研究现状12-13
1.5 本文的主要研究内容和章节安排13-15
1.5.1 主要研究内容13
1.5.2 文章安排13-15
第2章语音信号的处理方法15-26
2.1 引言15
2.2 时域处理15-21
2.2.1 短时平均能量和短时平均幅度15-17
2.2.2 短时过零分析17-19
2.2.3 短时自相关和平均幅度差函数19-21
2.3 时频处理21-23
2.3.1 短时傅里叶变换21-22
2.3.2 Wigner分布22-23
2.4 同态处理23-25
2.4.1 复倒谱和倒谱24
2.4.2 倒谱分析与同态解卷积24-25
2.5 本章小结25-26
第3章说话人特征参数的算法及其实现26-33
3.1 引言26
3.2 说话人特征参数26-29
3.2.1 MFCC参数26-28
3.2.2 ASCC参数28-29
3.2.3 实验仿真结果与分析29
3.3 基于时频处理的MFCC参数提取29-31
3.3.1 基于Wigner分布与DFT相结合的时频分析方法29-30
3.3.2 基于时频分析的MFCC参数提取过程30-31
3.4 实验仿真与结果分析31-32
3.5 本章小结32-33
第4章基于EMD的语音信号分解33-41
4.1 引言33
4.2 EMD分解33-37
4.2.1 EMD分解原理及分解的过程33-35
4.2.2 固有模态函数35-37
4.2.3 EMD端点效应37
4.3 Hilbert变换37-40
4.3.1 瞬时频率37-39
4.3.2 Hilbert谱与边际谱39-40
4.4 本章小结40-41
第5章基于EMD结合时频分析的特征参数提取法41-50
5.1 引言41
5.2 基于EMD加权的原理41-44
5.2.1 IMF幅值和频率信息42-43
5.2.2 权重的选择43-44
5.3 基于EMD加权MFCC参数提取44-46
5.3.1 语音信号的去清音处理44-45
5.3.2 基于EMD结合时频分析的特征提取流程图45-46
5.4 基于EMD的MFCC与ASCC混合参数的提取46
5.5 实验仿真与结果分析46-48
5.6 本章小结48-50
第6章总结与展望50-52
6.1 工作总结50-51
6.2 展望51-52
参考文献52-56
致谢56-57
附录A 个人简历、在校期间发表学术论文与研究成果57-58
附录B 论文中的用图58-60
附录C 论文中的用表60

【参考文献】

中国期刊全文数据库前1条

1 李天云,赵妍,李楠;基于EMD的Hilbert变换应用于暂态信号分析[J];电力系统自动化;2005年04期

中国硕士学位论文全文数据库前1条

1 王京辉;语音信号处理技术研究[D];山东大学;2008年

，

本文编号：978195

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/wltx/978195.html

上一篇：基于心智模式的老年人健康管理手机应用界面设计研究
下一篇：基于智能手机的泊车位判寻系统设计

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|