当前位置:主页 > 科技论文 > 软件论文 >

声纹识别中的时变鲁棒性问题研究

发布时间:2018-06-30 17:32

  本文选题:声纹识别 + 时变 ; 参考:《贵州大学》2016年硕士论文


【摘要】:声纹识别又称说话人识别,是生物特征识别的一种,自从声纹识别被提出以来,就有研究学者提出声纹识别的识别率是否会随着时间的变化而发生变化,经过多年的研究表声纹识别的识别率会随着时间的变化而发生变化。因此本文对声纹识别中的时变问题进行研究,主要工作包括:1.建立适合声纹识别时变特性的数据库。根据现有时变数据库可知时间越长识别率越差,但是较短的时间间隔同样也会对识别率产生影响。因此,结合实际应用,提出该数据库的设计原则:以一周为间隔,且等时间间隔,文本无关建立数据库。2.对说话人特征的时变特性进行分析。为了了解说话人特征的时变特性,需要减少其他因素的影响,因此我们选择同一个人在不同时间的相同文本进行分析,通过动态时间规整(DTW)发现时变特征的线性变化规律。根据线性变化的规律,采用不同的方法解决声纹识别中的时变鲁棒性问题。3.提出通过更新模型来提高时变鲁棒性的方法。以时间轴为位移方向,不断地更新训练模型的数据,同时去除相应时间较远的数据,从而做到不断更新训练模型,采用更新模型的方法提高鲁棒性是最直接并且最有效的办法,这样的方法可以保持与时俱进,有着良好的效果,但是同时也会大量的数据存储问题。4.声纹识别中的时变问题,在某种程度上可以看作是信道的变化,根据人的发生原理,人发声的变化主要是由于声道发生了变化,而声道的变化可以认为是信道的变化,在解决信道变化的问题上,在语音识别上就已经有人使用联合因子分析(Joint Factor Analysis,JFA),以及更进一步的发展的i-vector技术。因此本文利用i-vector技术利用解决说话人识别中时变问题。5.在使用i-vector的模型下,根据特征的时变特性,提出基于概率线性判别分析(Probabilistic Linear Discriminant Analysis,PLDA)的解决方法。由于特征随着时间的变化呈线性变化,我们认为可以通过PLDA学习出时变特征的线性变化,从而解决时变鲁棒性问题。
[Abstract]:Voice pattern recognition, also known as speaker recognition, is a kind of biometric recognition. Since the sound pattern recognition was put forward, some researchers have asked whether the recognition rate of voice pattern recognition will change with the change of time. Over the years, the recognition rate of voiceprint recognition will change with time. Therefore, the time-varying problem in voiceprint recognition is studied in this paper, the main work of which includes: 1. A database suitable for voiceprint recognition with time-varying characteristics is established. According to the existing time-varying database, the longer the time is, the worse the recognition rate is, but the shorter time interval will also affect the recognition rate. Therefore, combined with practical application, the design principle of the database is put forward: one week interval, and equal time interval, text independent establishment of database. 2. The time-varying characteristics of speaker features are analyzed. In order to understand the time-varying characteristics of the speaker, we need to reduce the influence of other factors, so we choose the same text at different times to analyze, and find out the linear variation of the time-varying features by dynamic time warping (DTW). According to the law of linear variation, different methods are used to solve the time-varying robustness problem in voiceprint recognition. A method to improve the time-varying robustness by updating the model is proposed. Taking the time axis as the displacement direction, the data of the training model is constantly updated, and the data of the corresponding time is removed at the same time, so that the training model can be continuously updated. It is the most direct and effective way to improve the robustness of the training model by updating the model. Such a method can keep pace with the times, with good results, but also a large number of data storage problems. To some extent, the time-varying problem in voiceprint recognition can be regarded as the change of the channel. According to the principle of human occurrence, the change of human voice is mainly due to the change of the channel, and the change of the channel can be regarded as the change of the channel. In order to solve the problem of channel change, joint factor analysis (JFAs) has been used in speech recognition, as well as the further development of i-vector technology. Therefore, this paper uses i-vector technology to solve the time-varying problem in speaker recognition. Under the model of i-vector, according to the time-varying characteristics of features, a method based on probabilistic linear discriminant analysis (PLAA) is proposed. Because the feature changes linearly with time, we think that we can learn the linear change of time-varying feature by PLDA, and solve the problem of time-varying robustness.
【学位授予单位】:贵州大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.41

【相似文献】

相关期刊论文 前10条

1 于哲舟,杨佳东,蒲东兵,周春光,王纲巧;多门限声纹识别方法[J];吉林大学学报(信息科学版);2005年02期

2 朱浩冰;郭东辉;;声纹识别系统原理及其关键技术[J];计算机安全;2007年09期

3 靳玉红;;声纹识别中的语言属性映射[J];重庆邮电大学学报(自然科学版);2012年04期

4 叶田田;;声纹识别系统设计[J];工业控制计算机;2012年06期

5 霍春宝;张彩娟;赵红敏;;与文本无关的声纹识别系统的研究[J];辽宁工业大学学报(自然科学版);2013年01期

6 杨凌;蔡涛;李瀚;;一种改进型回声状态网络及其在声纹识别上的应用[J];中国科技信息;2014年08期

7 陈幼松;从“芝麻开门”到声纹识别[J];百科知识;2003年01期

8 任培花;孙宏志;;基于言语过滤、情感补偿的活体声纹识别系统的设计[J];重庆科技学院学报(自然科学版);2007年01期

9 王会清;张涛;周帆;;声纹识别在虚拟仪器平台的实现[J];武汉工程大学学报;2012年12期

10 何金鑫;康凯;关胜晓;;与文本无关的声纹识别系统的研究[J];电子技术;2013年02期

相关会议论文 前2条

1 杨莹春;雷震春;吴朝晖;;基于情感补偿的活体声纹识别框架研究[A];第一届中国情感计算及智能交互学术会议论文集[C];2003年

2 黄晓丹;洪青阳;李琳;李稀敏;梁大伟;陈万里;吕伟辰;丘敬云;王薇;;声纹识别语音数据库建设的探讨[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年

相关重要报纸文章 前5条

1 闫洁;声纹识别高精尖听音辨人不遥远[N];新华每日电讯;2014年

2 吴玺宏;声纹识别应用前景[N];计算机世界;2001年

3 邢方亮;以声辨人[N];计算机世界;2003年

4 北京大学信息科学中心视觉与听觉信息处理国家重点实验室 吴玺宏;声纹识别听声辨人[N];计算机世界;2001年

5 本报记者 霍娜;云上积累 云中绽放[N];中国计算机报;2014年

相关博士学位论文 前1条

1 张晶;声纹识别鲁棒性技术及应用研究[D];广东工业大学;2015年

相关硕士学位论文 前10条

1 于娴;声纹识别在微信中的模式匹配研究[D];贵州大学;2015年

2 刘磊;声纹识别算法在军事通话中的研究与实现[D];东北大学;2014年

3 陈俊彬;融合声纹识别的护理床语音控制系统研发[D];广东工业大学;2016年

4 周雷;基于声纹识别的说话人身份确认方法的研究[D];上海师范大学;2016年

5 胡青;卷积神经网络在声纹识别中的应用研究[D];贵州大学;2016年

6 陈霄鹏;声纹识别中的时变鲁棒性问题研究[D];贵州大学;2016年

7 陈燕;用户定制口令声纹识别系统研究与嵌入式实现[D];厦门大学;2009年

8 彭诗雅;基于声纹识别的身份认证技术研究[D];南京航空航天大学;2010年

9 付浩楠;声纹识别在声控系统中的研究与实现[D];黑龙江大学;2012年

10 张转侠;基于双序混合最优码本的声纹识别系统研究[D];重庆大学;2012年



本文编号:2086299

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2086299.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a9823***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com