低信噪比环境下说话人识别研究

发布时间:2019-03-25 19:35
【摘要】:说话人识别是一种利用语音信号来验证身份信息的生物识别技术。现实中,说话人识别系统受制于语音中的噪声,系统的识别性能降低。说话人识别朝着商业应用发展,并且在噪声较强环境下的说话人识别正成为研究热点。而现有的技术在强噪声的低信噪比环境下,性能大幅下降。这对说话人识别提出了新的要求。目前低信噪比环境下的说话人识别存在三个待解决的关键问题。1.现有的说话人识别特征参数,在低信噪比的环境下,其自身鲁棒性急剧下降,无法满足说话人识别对特征参数的要求。2.在低信噪比环境下,现有的特征补偿方法性能下降,无法有效地提高特征参数的鲁棒性。3.现有说话人识别模型在低信噪比环境下性能降低或只能针对某类特殊噪声鲁棒性较好。论文在对噪声环境下的说话人识别进行深入研究的基础上,对于以上三个待解决的关键问题,分别研究了低信噪比环境下的鲁棒特征参数、特征补偿和识别模型。主要研究内容和创新点如下。1.针对低信噪比噪声环境下,说话人识别的特征参数鲁棒性下降的问题,论文提出感知语谱规整耳蜗滤波倒谱系数的特征提取方法。方法先构建符合耳蜗基底膜行波冲激响应及非线性频率分布的耳蜗滤波器组,使特征参数的提取过程在频域中拟合心理声学实验结果从而提高特征参数的鲁棒性。再由人耳感知特性的语音增强以及一个时-频域的二维增强,通过二维数据的边界检测得到感知语谱规整参数。并把耳蜗滤波器组的输出进一步规整为时-频域鲁棒性更好的感知语谱规整耳蜗滤波倒谱系数。实验结果表明,在所有测试的信噪比条件下,论文提出的特征参数,在所有实验噪声中的平均识别率,分别比另外三种特征参数高出26.6%,22.2%以及18.5%,而在-10d B到10d B的信噪比条件下,提出的特征参数在所有条件中获得了最好的识别率。在低信噪比条件下,提出的感知语谱规整耳蜗滤波倒谱系数对不同噪声都具有相对较好的鲁棒性。2.针对低信噪比说话人识别中特征补偿方法鲁棒性下降的问题,提出了一种采用感知听觉场景分析的特征补偿方法。先求取语音的缺失数据特征谱,并由语音的感知特性求出感知特性的语音含量。含噪语音经过感知特性的语音增强和对其语谱的二维增强后求解出语音的分布,联合感知特性语音含量和缺失强度参数提取出感知听觉因子。再结合缺失数据特征谱把特征补偿的过程分解为不同听觉场景进行区分地分析和处理,从而增强特征参数的鲁棒性能。实验结果表明,在-10d B到10d B的低信噪比环境下,对于四种不同的噪声,提出的方法比另外五种方法的鲁棒性均有提高,平均识别率分别提高26.0%,19.6%,12.7%,4.6%和6.5%。论文提出的方法,是一种在时-频域中提高语音特征鲁棒性的方法,更适合于低信噪比环境下的说话人识别。3.针对低信噪比说话人识别中模型鲁棒性下降的问题,提出了一个混合条件噪声场模型。它通过分数阶离散转移函数,把White噪声作为基噪声,Pink噪声作为指导噪声,构建了一个从白噪声到棕色噪声渐变的一系列有色噪声。并且以不同的信噪比加入到训练语音中,然后构建一个拥有各种噪声条件和各种信噪比条件的混合条件噪声场。再对混合条件噪声场中的每个说话人语音都构建模型,形成混合条件噪声场模型。识别时先在混合条件噪声场模型的每个说话人模型中找到匹配的混合条件噪声场模型,再在所有说话人中识别出说话人。实验结果表明,在所有的四种实验噪声中,提出的模型在-10d B到10d B信噪比下的平均识别率,分别比基线模型和另外两种参考模型高出42.7%,32.2%以及21.1%。提出的说话人识别模型更适用于低信噪比的环境。
[Abstract]:......
【学位授予单位】:苏州大学
【学位级别】:博士
【学位授予年份】:2016
【分类号】:TN912.34

【相似文献】

相关期刊论文 前10条

1 石艳;王晓晔;;新颖检测法在说话人识别技术中的应用[J];现代计算机(专业版);2008年07期

2 刘雪燕;张娜;袁宝玲;;说话人识别综述[J];电脑知识与技术;2009年01期

3 邱政权;范小春;王俊年;;基于动态环境下的说话人识别[J];科学技术与工程;2010年02期

4 单进;;说话人识别技术研究[J];科技资讯;2010年21期

5 申志生;于明;;说话人识别算法的定点DSP实现[J];单片机与嵌入式系统应用;2011年03期

6 谢建勋;;浅谈说话人识别技术[J];电脑知识与技术;2011年11期

7 安茂波;刘建;;一个快速说话人识别系统的设计和实现[J];网络新媒体技术;2012年03期

8 杨迪;戚银城;刘明军;张华芳子;武军娜;;说话人识别综述[J];电子科技;2012年06期

9 武光利;;说话人识别方法概述[J];硅谷;2012年19期

10 曹业敏,侯风雷,王炳锡;说话人识别技术现状与进展[J];河南科技;1998年09期

相关会议论文 前10条

1 鲍福良;方志刚;徐洁;;说话人识别综述[A];第六届全国信息获取与处理学术会议论文集(2)[C];2008年

2 孙帆;迟惠生;;循环网络说话人识别[A];第二届全国人机语音通讯学术会议论文集[C];1992年

3 肖剑;欧贵文;;多层前馈神经网络组的文本无关说话人识别[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年

4 张玲华;郑宝玉;杨震;;模糊超椭球聚类算法及其在说话人识别中的应用研究[A];第八届全国人机语音通讯学术会议论文集[C];2005年

5 王宏;潘金贵;;基于矩阵正态分布的文本有关说话人识别[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年

6 戴红霞;赵力;;文本无关说话人识别系统的研究[A];2007’促进西部发展声学学术交流会论文集[C];2007年

7 陈联武;郭武;戴礼荣;;说话人识别系统中多样训练的应用[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年

8 崔玉红;胡光锐;;基于神经网络特征维数压缩方法及其在说话人识别中的应用[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年

9 吴丽丽;;基于仿生模式识别的说话人识别学习模型研究[A];第二届中国科学院博士后学术年会暨高新技术前沿与发展学术会议程序册[C];2010年

10 张晶;董金明;冯文全;;说话人识别系统研究与实现[A];全国第二届信号处理与应用学术会议专刊[C];2008年

相关重要报纸文章 前2条

1 汪永安;科大讯飞说话人识别技术世界领先[N];安徽日报;2008年

2 吴长锋;科大讯飞勇夺说话人识别国际大赛第一[N];科技日报;2008年

相关博士学位论文 前10条

1 单振宇;情感说话人识别及其解决方法的研究[D];浙江大学;2010年

2 别凡虎;说话人识别中区分性问题的研究[D];清华大学;2015年

3 谢怡宁;基于稀疏编码的鲁棒说话人识别方法研究[D];哈尔滨理工大学;2016年

4 安冬;噪声背景下说话人识别的若干关键问题研究[D];东北大学;2013年

5 吴迪;低信噪比环境下说话人识别研究[D];苏州大学;2016年

6 陆伟;基于缺失特征的文本无关说话人识别鲁棒性研究[D];中国科学技术大学;2008年

7 刘镝;说话人识别中信息融合算法的研究[D];北京交通大学;2011年

8 付中华;说话人识别系统鲁棒性研究[D];西北工业大学;2004年

9 林琳;基于模糊聚类与遗传算法的说话人识别理论研究及应用[D];吉林大学;2007年

10 邱政权;在噪声环境下的说话人识别[D];华南理工大学;2007年

相关硕士学位论文 前10条

1 丛菡菡;基于支持相量机的稳键说话人识别[D];电子科技大学;2008年

2 任舒彬;面向手持应用的说话人识别算法研究[D];浙江大学;2006年

3 申志生;文本相关说话人识别嵌入式系统及其关键技术研究[D];河北工业大学;2011年

4 汪q,

本文编号:2447252


资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/2447252.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1efd9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com