当前位置:主页 > 科技论文 > 信息工程论文 >

基于多特征I-Vector的短语音说话人识别方法研究

发布时间:2020-10-13 12:43
   近年来,说话人识别作为人机交互领域的一个主要研究方向之一,已经在现实生活中得到了广泛的应用。然而在实际应用中,能够提取到的说话人语音较短,导致系统识别效果较差。因此,本文研究的主要内容为短语音说话人识别系统。首先,本文概述了说话人识别系统的总体框架,并分别描述了各模块的性能以及处理过程,明确地把特征提取和匹配模型部分作为本文的主要研究方向。其次,在说话人特征提取部分,针对短语音条件下,单一特征的MFCC特征参数无法充分表征说话人特性的问题,利用不同特征可以从不同的角度对说话人特征分布进行描述的优点,确定了3种常用特征参数作为说话人特征,分别是:MFCC、GFCC和LPCC。考虑到直接拼接的特征无法获得很好的识别性能,提出了基于Fisher比的MFCC、GFCC和LPCC的多特征融合算法,并把新特征命名为LP_MGFCC。该种算法有效地利用了不同特征分量在识别系统中的贡献率不同的特点,通过选取系统贡献率较高的特征分量,进而提升了系统的识别效果。接着,由于融合的LP_MGFCC特征分量之间存在一定的相关和冗余信息,为了进一步提升短语音说话人识别性能,提出了基于PCA和LDA的LP_MGFCC特征补偿算法,得到了正交且说话人区分性较强的特征,同时,小了计算复杂度。再者,匹配模型的选择对短语音说话人识别系统的性能也会产生影响。本文对GMM-UBM模型进行深入研究,并通过实验确定了模型的混合度为1024时,系统的性能最优。同时,介绍了目前主流的I-Vector模型,并分析了I-Vector模型相比于GMM-UBM模型的优势,并在本文测试语音较短的情况下,对两种模型进行了实验对比,结果表明I-Vector模型相比于GMM-UBM模型具有更好的识别性能。最后,本文对基于多特征I-Vector的短语音说话人识别系统进行了仿真实验。在测试语音为8s时,验证了不同特征在基线I-Vector说话人识别系统中的性能,结果表明本文提出的多特征算法具有更好的识别性能。同时,在不同的测试短语音下,验证了本文提出算法的EER相对于基线系统的EER有约50%的提升,且本文提出算法的minDCF相对于基线系统的minDCF也有约50%的提升。
【学位单位】:重庆邮电大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:TN912.34
【部分图文】:

框架图,框架图,说话人,模块


说话人识别系统的总体框架主要包括语音信号的预处理模块、特征提取模块、型匹配模块和得分判决模块。本章将简要分析每个模块的性能和处理过程,为后章节的算法改进提供了理论依据。2.1 说话人识别的系统框架说话人识别的任务是根据话者的语音信息确定话者的身份。实际上,说话人别是属于模式识别的范畴,它的基本原理为:建立每个说话人的语音模型,使其够最大程度地描述说话人的个体生理特征,再将这个语音模型作为参考模型,与样得到的语音模型进行对比分析,从而达到辨认或确认说话人的目的[25]。说话人别系统主要包括语音信号的预处理模块、特征提取模块、模型匹配模块和得分判模块。图 2.1 为说话人识别系统框架。

示意图,语音信号,分帧,示意图


[][][1]~x n xn xn 段未处理的语音信号整体上看是非平稳的,这使信号进行分析和建模,通常把说话人语音信号切分帧,每帧长度在 20~30ms,在这一区间内的语音信号的短时平稳性,其频谱特性几乎不变。而为一帧,可以把整段语音信号的分析转化成对每以采用连续分段的方法,但是普遍采用交叠分段帧移,其长度一般为 0~1/2 倍帧长,图 2.3 为语音

匹配模型,特征提取,模块,说话人


图 2.4 DET 曲线的示例图本章小结本章详细地描述了说话人识别系统的整体框架,并分别地介绍了说话人识的预处理模块、特征提取模块、匹配模型模块和得分判决模块。同时,简了说话人识别系统的性能评价指标。最后明确地把特征提取和匹配模型作节的主要研究内容。
【相似文献】

相关期刊论文 前10条

1 刘倩;李时;;细菌趋药性算法在说话人识别中的应用[J];宿州学院学报;2017年11期

2 赵艳;吕亮;赵力;;基于修正Fukunaga-Koontz变换的说话人识别方法[J];电子器件;2018年04期

3 李为州;杨印根;;说话人识别中基于深度信念网络的超向量降维的研究[J];电脑知识与技术;2017年22期

4 雷震春;万艳红;罗剑;朱明华;;基于Mahalanobis距离的说话人识别模型研究[J];中国语音学报;2016年00期

5 王华朋;李宁;许锋;蔡能斌;;基于元音共振峰特征的法庭说话人识别[J];中国刑警学院学报;2014年02期

6 王华朋;杨军;许勇;;应用似然比框架的法庭说话人识别[J];数据采集与处理;2013年02期

7 檀蕊莲;刘建平;;说话人识别技术的研究进展[J];科技资讯;2007年33期

8 宁飞,陈频;说话人识别的几种方法[J];电声技术;2001年12期

9 曹业敏,侯风雷,王炳锡;说话人识别技术现状与进展[J];河南科技;1998年09期

10 王华朋;杨军;吴鸣;许勇;;基于自适应同源方差控制的法庭自动说话人识别[J];应用科学学报;2014年06期


相关博士学位论文 前10条

1 徐珑婷;基于稀疏分解的说话人识别技术研究[D];南京邮电大学;2017年

2 陆伟;基于缺失特征的文本无关说话人识别鲁棒性研究[D];中国科学技术大学;2008年

3 俞一彪;基于互信息理论的说话人识别研究[D];上海大学;2004年

4 付中华;说话人识别系统鲁棒性研究[D];西北工业大学;2004年

5 侯丽敏;基于非线性理论和信息融合的说话人识别[D];上海大学;2005年

6 雷震春;支持向量机在说话人识别中的应用研究[D];浙江大学;2006年

7 姚志强;说话人识别中提高GMM性能方法的研究[D];中国科学技术大学;2006年

8 包永强;噪声环境下说话人识别的研究[D];东南大学;2006年

9 林琳;基于模糊聚类与遗传算法的说话人识别理论研究及应用[D];吉林大学;2007年

10 解焱陆;基于特征变换和分类的文本无关电话语音说话人识别研究[D];中国科学技术大学;2007年


相关硕士学位论文 前10条

1 姜孝伟;说话人识别系统的设计与研究[D];上海交通大学;2018年

2 陈松;基于VQ的室内说话人识别及FPGA实现研究[D];安徽理工大学;2019年

3 蔡国都;基于x-vector的说话人识别研究[D];北京交通大学;2019年

4 孙念;基于多特征I-Vector的短语音说话人识别方法研究[D];重庆邮电大学;2019年

5 巴莉芳;基于含噪语音的说话人识别研究[D];重庆邮电大学;2019年

6 刘崇鸣;基于三元组损失与流形降维的文本无关说话人识别方法研究[D];哈尔滨工业大学;2019年

7 林婷;基于ICA和ASR语音特征选取的说话人识别算法[D];南昌大学;2019年

8 陈园允;变形欺骗性语音的检测算法研究及对其鲁棒的说话人识别系统实现[D];广东技术师范大学;2019年

9 徐钰婷;跨语言背景下基于单元音的说话人识别研究[D];深圳大学;2018年

10 陈莉芬;基于英语爆破音和摩擦音的跨语言说话人识别研究[D];深圳大学;2018年



本文编号:2839181

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/2839181.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户63230***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com