基于i-vector的稳健说话人识别研究
本文关键词:基于i-vector的稳健说话人识别研究
更多相关文章: Kaldi工具箱 说话人识别 特征提取 降噪编码器 i-vector
【摘要】:说话人识别就是能够让机器分辨出不同人的声音来,主要是以语音信号为研究对象,它由特征提取和模式识别两大部分组成;其中,如何高效地找到区别不同说话人之间的个性特征一直以来是需要攻克的难点。在没有噪声干扰条件下的说话人识别系统的正确率能够达到百分之九十五以上;但是在有噪声的影响下,系统识别的正确率就会受到很大的影响,如何提高有噪声干扰环境下的说话人识别的正确率也是一个重要的研究方向。本文是以Kaldi语音识别工具为平台进行的仿真实验,Kaldi由前微软公司研究院的Dan Povey博士与捷克的BUT大学联合开发的,用C++编写而成的一个开源工具包,便于根据不同的实验目的进行修改和扩展。论文先从介绍说话人识别的基本知识入手,接着又全面地介绍了传统说话人识别算法,以及目前主流的说话人识别技术i-vector,并且结合Kaldi语音识别工具对说话人识别系统的训练参数进行了优化。针对带噪条件下说话人识别率低的情况,本文采用深度学习领域的降噪自编码器和i-vector相结合的方法来提高识别率。我们知道噪声与语音信号之间有着相当复杂的关系,但在日常生活中声音主要受到加性噪声的影响,因此本文重点研究了高斯白噪声对系统稳定性的影响,先后设置了信噪比为0分贝、5分贝、10分贝、15分贝、20分贝的带噪语音信号,用降噪自编码器对信号中的噪声进行抑制,保留说话人的个性特征,进而提高i-vector的稳健说话人识别系统的性能。实验结果表明,特别是在低信噪比条件下系统的识别率较低,但在去噪后i-vector的识别率明显得到提升。
【学位授予单位】:新疆大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN912.34
【相似文献】
中国期刊全文数据库 前10条
1 石艳;王晓晔;;新颖检测法在说话人识别技术中的应用[J];现代计算机(专业版);2008年07期
2 刘雪燕;张娜;袁宝玲;;说话人识别综述[J];电脑知识与技术;2009年01期
3 邱政权;范小春;王俊年;;基于动态环境下的说话人识别[J];科学技术与工程;2010年02期
4 单进;;说话人识别技术研究[J];科技资讯;2010年21期
5 申志生;于明;;说话人识别算法的定点DSP实现[J];单片机与嵌入式系统应用;2011年03期
6 谢建勋;;浅谈说话人识别技术[J];电脑知识与技术;2011年11期
7 安茂波;刘建;;一个快速说话人识别系统的设计和实现[J];网络新媒体技术;2012年03期
8 杨迪;戚银城;刘明军;张华芳子;武军娜;;说话人识别综述[J];电子科技;2012年06期
9 武光利;;说话人识别方法概述[J];硅谷;2012年19期
10 曹业敏,侯风雷,王炳锡;说话人识别技术现状与进展[J];河南科技;1998年09期
中国重要会议论文全文数据库 前10条
1 鲍福良;方志刚;徐洁;;说话人识别综述[A];第六届全国信息获取与处理学术会议论文集(2)[C];2008年
2 孙帆;迟惠生;;循环网络说话人识别[A];第二届全国人机语音通讯学术会议论文集[C];1992年
3 肖剑;欧贵文;;多层前馈神经网络组的文本无关说话人识别[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
4 张玲华;郑宝玉;杨震;;模糊超椭球聚类算法及其在说话人识别中的应用研究[A];第八届全国人机语音通讯学术会议论文集[C];2005年
5 王宏;潘金贵;;基于矩阵正态分布的文本有关说话人识别[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
6 戴红霞;赵力;;文本无关说话人识别系统的研究[A];2007’促进西部发展声学学术交流会论文集[C];2007年
7 陈联武;郭武;戴礼荣;;说话人识别系统中多样训练的应用[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
8 崔玉红;胡光锐;;基于神经网络特征维数压缩方法及其在说话人识别中的应用[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
9 吴丽丽;;基于仿生模式识别的说话人识别学习模型研究[A];第二届中国科学院博士后学术年会暨高新技术前沿与发展学术会议程序册[C];2010年
10 张晶;董金明;冯文全;;说话人识别系统研究与实现[A];全国第二届信号处理与应用学术会议专刊[C];2008年
中国重要报纸全文数据库 前2条
1 汪永安;科大讯飞说话人识别技术世界领先[N];安徽日报;2008年
2 吴长锋;科大讯飞勇夺说话人识别国际大赛第一[N];科技日报;2008年
中国博士学位论文全文数据库 前10条
1 单振宇;情感说话人识别及其解决方法的研究[D];浙江大学;2010年
2 别凡虎;说话人识别中区分性问题的研究[D];清华大学;2015年
3 谢怡宁;基于稀疏编码的鲁棒说话人识别方法研究[D];哈尔滨理工大学;2016年
4 陆伟;基于缺失特征的文本无关说话人识别鲁棒性研究[D];中国科学技术大学;2008年
5 刘镝;说话人识别中信息融合算法的研究[D];北京交通大学;2011年
6 付中华;说话人识别系统鲁棒性研究[D];西北工业大学;2004年
7 林琳;基于模糊聚类与遗传算法的说话人识别理论研究及应用[D];吉林大学;2007年
8 邱政权;在噪声环境下的说话人识别[D];华南理工大学;2007年
9 郭武;复杂信道下的说话人识别[D];中国科学技术大学;2007年
10 钱博;基于汉语元音映射的说话人识别技术研究[D];南京理工大学;2007年
中国硕士学位论文全文数据库 前10条
1 丛菡菡;基于支持相量机的稳键说话人识别[D];电子科技大学;2008年
2 任舒彬;面向手持应用的说话人识别算法研究[D];浙江大学;2006年
3 申志生;文本相关说话人识别嵌入式系统及其关键技术研究[D];河北工业大学;2011年
4 汪q,
本文编号:1145026
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1145026.html