基于小波变换的声纹参数提取方法与实现
发布时间:2017-12-08 12:12
本文关键词:基于小波变换的声纹参数提取方法与实现
更多相关文章: 声纹参数 小波变换 能量 矢量量化 语音信号
【摘要】:容不同对提取声纹参数的影响,在分帧阶段采用帧长为2560点,增长有效语音段。并通过仿真对比一帧语音信号的WPT参数与MFCC参数,得出16个MFCC参数中,只有前面约七、八个值比较明显外,后面的值都非常小,趋于零,不利于刻画说话人的特征。相反,16个WPT参数变化比较大,更有利于描述不同说话人的特征。可见相比于MFCC参数,MFCC参数更好地表征了语音特征参数随时间的动态变化特性,从而有利于提高识别率。为了更进一步验证性能,再分别进行16维MFCC参数和WPT参数前10帧仿真实验。明显地发现,通过与MFCC参数仿真图对比,各帧之间WPT参数的形状更相似,即表示的特征更接近。因此,WPT参数用于说话人识别时要优于MFCC参数。在MATLAB平台上,用基于矢量量化(VQ)的声纹识别系统进行实验来分别验证所提取到的参数的识别率,并通过比较常用的db3、db4、db6、coif3小波函数选取最优基。实验证明,相对于常用的256点帧长,帧长为2560点的识别率较高且提高了运算速率。coif3小波函数为声纹参数提取的最优基。新的WPT参数的识别率优于传统的MFCC参数。在声纹识别系统中,能否提取到精准的声纹参数至关重要,因为它直接影响整个系统的识别率。而传统的最为广泛应用的MFCC参数虽然是模仿人耳的听觉特性提出来的,但它却忽略了语音信号的动态特性。而小波变换因其不会受到短时平稳假设的约束,以及良好的动态特性,所以更符合人耳的听觉特性。因而可以被应用到对语音信号的处理方面,因此本文提出了一种基于小波变换的声纹参数提取方法(WPT参数法)。对于文本无关的声纹识别系统,为了更突出说话人的声纹特征,克服说话内
【学位授予单位】:沈阳理工大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.3
【参考文献】
中国期刊全文数据库 前1条
1 王和平;潘宏侠;黄晋英;;基于小波特征提取的语音监测系统[J];微计算机信息;2010年12期
,本文编号:1266338
本文链接:https://www.wllwen.com/kejilunwen/wltx/1266338.html