基于稀疏表示的鲁棒性说话人识别技术研究
本文关键词:基于稀疏表示的鲁棒性说话人识别技术研究
更多相关文章: 说话人识别 稀疏表示 鲁棒性 全局补偿 超向量
【摘要】:经过了几十年的研究发展,说话人识别技术凭借其快速、简便的优势,在人机接入领域得到了大家广泛的关注和研究。匹配模型是说话人识别研究中的关键技术,模型性能的优劣对识别系统识别率的影响重大。信号的稀疏表示技术近几年被广泛应用于说话人识别之中,它与高斯混合模型相结合,显著提高了识别系统的准确率。目前,说话人识别研究的主要方向是进一步提高系统的鲁棒性,具体表现为解决信道失配问题和环境噪声问题;另一方面,在智能终端广泛普及情况下,借助智能终端进行快速准确的身份识别,需要进一步解决系统复杂性问题。本文主要对基于稀疏表示的鲁棒性说话人识别技术进行了深入研究,在此基础上,本文主要工作和创新如下:(1)在训练基于高斯混合模型均值超向量的稀疏表示字典时,需要大量的训练语音以达到字典冗余的条件,本文提出使用高斯混合模型均值矩阵代替均值超向量进行字典训练来解决这个问题,同时,每个说话人即可形成一个冗余字典进行说话人识别,识别时的计算量也得到了降低。(2)对比了样本字典和学习字典这两种字典在干净语音环境与有噪语音环境下的性能,发现学习字典的抗噪能力要弱于样本字典,并且提出在训练语音中加入噪声以减小识别环境和训练环境的差异,从而提高识别率。(3)针对识别时的环境噪声问题,提出一种适用于稀疏表示说话人识别的全局补偿方法。该方法对不同阶特征参数进行逐一分析,目的是为了找出被噪声影响最严重的一阶参数并去除之,以此增强测试语音与训练语音之间的相关性,提高了识别系统适应不同噪声环境的鲁棒性。仿真实验结果表明本文方法明显加强了说话人识别系统的抗噪能力,在背景噪声为白噪声,信噪比为15dB的情况下,识别率可达到96%,与无噪环境下的识别率相差无几。
【关键词】:说话人识别 稀疏表示 鲁棒性 全局补偿 超向量
【学位授予单位】:南京邮电大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.34
【目录】:
- 摘要4-5
- Abstract5-8
- 缩略词注释表8-9
- 第一章 绪论9-16
- 1.1 背景及意义9
- 1.2 说话人识别的研究历史9-11
- 1.3 说话人识别的研究趋势11-12
- 1.4 说话人识别研究的挑战和热点12-13
- 1.5 说话人识别的应用13-14
- 1.6 论文内容和结构安排14-16
- 第二章 说话人识别理论基础16-31
- 2.1 说话人识别系统流程16-17
- 2.2 语音预处理17
- 2.3 常用的特征参数17-22
- 2.3.1 线性预测系数及线性预测倒谱系数18-19
- 2.3.2 Mel频率倒谱系数19-21
- 2.3.3 差分特征(Delta特征)21-22
- 2.4 常用的识别模型22-29
- 2.4.1 高斯混合模型(GMM)22-26
- 2.4.2 隐马尔可夫模型HMM26-27
- 2.4.3 矢量量化模型(VQ)27-28
- 2.4.4 支持向量机模型(SVM)28-29
- 2.5 系统性能评价29-30
- 2.6 本章小结30-31
- 第三章 基于稀疏表示与GMM均值矩阵的识别模型研究31-44
- 3.1 稀疏表示31-33
- 3.1.1 稀疏表示基础理论31-32
- 3.1.2 常用稀疏表示算法32-33
- 3.2 基于稀疏表示的说话人识别33-35
- 3.3 基于稀疏表示与GMM均值矩阵的识别模型35-38
- 3.3.1 说话人识别模型建立35-36
- 3.3.2 识别过程36-38
- 3.4 仿真实验语音库和参数设置38-39
- 3.4.1 语音库38
- 3.4.2 实验参数设置38-39
- 3.5 识别仿真39-42
- 3.5.1 实验一:稀疏度对识别率的影响39-40
- 3.5.2 实验二:字典大小对识别率的影响40
- 3.5.3 实验三:高斯混合度对识别率的影响40-42
- 3.5.4 实验四:测试语音长度对识别率的影响42
- 3.6 本章小结42-44
- 第四章 稀疏表示字典性能研究44-49
- 4.1 字典分类44-45
- 4.1.1 样本字典44
- 4.1.2 K-SVD学习字典44-45
- 4.2 字典性能对比45-48
- 4.2.1 无噪环境下性能对比46
- 4.2.2 有噪环境下性能对比46-47
- 4.2.3 有噪环境下识别字典的设计47-48
- 4.3 本章小结48-49
- 第五章 噪声环境下基于稀疏表示的说话人识别49-61
- 5.1 基于稀疏表示的全局补偿方法50-51
- 5.2 全局补偿方法51-54
- 5.2.1 字典训练51-52
- 5.2.2 识别过程52-54
- 5.3 仿真实验54-59
- 5.3.1 实验一:噪声环境下不同方法的识别率对比55-57
- 5.3.2 实验二:添加不同噪声进行字典训练效果对比57-58
- 5.3.3 实验三:稀疏度对识别结果的影响58-59
- 5.3.4 实验四:多阶去除59
- 5.4 本章小结59-61
- 第六章 总结与展望61-63
- 6.1 论文总结61-62
- 6.2 工作展望62-63
- 参考文献63-68
- 附录1 攻读硕士学位期间撰写的论文68-69
- 附录2 攻读硕士学位期间参加的科研项目69-70
- 致谢70
【相似文献】
中国期刊全文数据库 前10条
1 石艳;王晓晔;;新颖检测法在说话人识别技术中的应用[J];现代计算机(专业版);2008年07期
2 刘雪燕;张娜;袁宝玲;;说话人识别综述[J];电脑知识与技术;2009年01期
3 邱政权;范小春;王俊年;;基于动态环境下的说话人识别[J];科学技术与工程;2010年02期
4 单进;;说话人识别技术研究[J];科技资讯;2010年21期
5 申志生;于明;;说话人识别算法的定点DSP实现[J];单片机与嵌入式系统应用;2011年03期
6 谢建勋;;浅谈说话人识别技术[J];电脑知识与技术;2011年11期
7 安茂波;刘建;;一个快速说话人识别系统的设计和实现[J];网络新媒体技术;2012年03期
8 杨迪;戚银城;刘明军;张华芳子;武军娜;;说话人识别综述[J];电子科技;2012年06期
9 武光利;;说话人识别方法概述[J];硅谷;2012年19期
10 曹业敏,侯风雷,王炳锡;说话人识别技术现状与进展[J];河南科技;1998年09期
中国重要会议论文全文数据库 前10条
1 鲍福良;方志刚;徐洁;;说话人识别综述[A];第六届全国信息获取与处理学术会议论文集(2)[C];2008年
2 孙帆;迟惠生;;循环网络说话人识别[A];第二届全国人机语音通讯学术会议论文集[C];1992年
3 肖剑;欧贵文;;多层前馈神经网络组的文本无关说话人识别[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
4 张玲华;郑宝玉;杨震;;模糊超椭球聚类算法及其在说话人识别中的应用研究[A];第八届全国人机语音通讯学术会议论文集[C];2005年
5 王宏;潘金贵;;基于矩阵正态分布的文本有关说话人识别[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
6 戴红霞;赵力;;文本无关说话人识别系统的研究[A];2007’促进西部发展声学学术交流会论文集[C];2007年
7 陈联武;郭武;戴礼荣;;说话人识别系统中多样训练的应用[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
8 崔玉红;胡光锐;;基于神经网络特征维数压缩方法及其在说话人识别中的应用[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
9 吴丽丽;;基于仿生模式识别的说话人识别学习模型研究[A];第二届中国科学院博士后学术年会暨高新技术前沿与发展学术会议程序册[C];2010年
10 张晶;董金明;冯文全;;说话人识别系统研究与实现[A];全国第二届信号处理与应用学术会议专刊[C];2008年
中国重要报纸全文数据库 前2条
1 汪永安;科大讯飞说话人识别技术世界领先[N];安徽日报;2008年
2 吴长锋;科大讯飞勇夺说话人识别国际大赛第一[N];科技日报;2008年
中国博士学位论文全文数据库 前10条
1 单振宇;情感说话人识别及其解决方法的研究[D];浙江大学;2010年
2 陆伟;基于缺失特征的文本无关说话人识别鲁棒性研究[D];中国科学技术大学;2008年
3 刘镝;说话人识别中信息融合算法的研究[D];北京交通大学;2011年
4 付中华;说话人识别系统鲁棒性研究[D];西北工业大学;2004年
5 林琳;基于模糊聚类与遗传算法的说话人识别理论研究及应用[D];吉林大学;2007年
6 邱政权;在噪声环境下的说话人识别[D];华南理工大学;2007年
7 郭武;复杂信道下的说话人识别[D];中国科学技术大学;2007年
8 钱博;基于汉语元音映射的说话人识别技术研究[D];南京理工大学;2007年
9 姜涛;网络环境下说话人识别关键技术研究[D];哈尔滨工业大学;2011年
10 俞一彪;基于互信息理论的说话人识别研究[D];上海大学;2004年
中国硕士学位论文全文数据库 前10条
1 丛菡菡;基于支持相量机的稳键说话人识别[D];电子科技大学;2008年
2 任舒彬;面向手持应用的说话人识别算法研究[D];浙江大学;2006年
3 申志生;文本相关说话人识别嵌入式系统及其关键技术研究[D];河北工业大学;2011年
4 汪q,
本文编号:760423
本文链接:https://www.wllwen.com/kejilunwen/wltx/760423.html