基于非重构压缩采样的抗噪说话人识别技术研究
本文关键词:基于非重构压缩采样的抗噪说话人识别技术研究
更多相关文章: 说话人识别 鲁棒性 压缩感知 语音增强 加权融合
【摘要】:随着计算机的产生和互联网技术的发展,说话人识别作为生物认证的一种,凭借其独一无二的优势在人机交互领域一直备受关注。说话人识别技术已经从实验室转向了实际应用中,同时用户对其准确性、友好性和鲁棒性的要求越来越高。在实际应用环境中,说话人识别性能受到诸多因素影响,其中最主要的因素是环境噪声的存在。环境噪声污染了采集的语音信号,导致训练数据集和测试数据集之间的匹配度降低,引起识别性能下降。另一方面,随着云计算、大数据产业的发展,人们获得的信息量不断增加,为了减轻传输和处理数据的负担,信号的压缩感知技术应运而生。奈奎斯特采样下的说话人识别,当为了确保高的识别率而采集较长时间说话人语音时,采样数据量特别大,其中有许多冗余造成了采样资源的浪费,压缩感知理论可以很好地解决此问题。本文将压缩感知理论应用到噪声环境下的说话人识别系统中,直接对观测矩阵压缩后的观测序列进行特征提取,针对基于压缩感知的鲁棒性说话人识别进行研究,论文工作是导师国家自然科学基金工作的一部分,本文主要工作和创新如下:(1)研究压缩感知压缩比和语音分帧长度对识别系统性能影响。对行阶梯矩阵投影下的观测序列展开研究,研究压缩比和帧长对识别率的影响。发现在压缩比为1:2时,识别性能与传统方法相当;帧长过短或过长时,说话人识别率有明显的下降趋势,一般所取的帧长在20ms-30ms左右。(2)研究在有噪环境下语音压缩感知识别系统的特征参数和消噪技术。首先提出了基于谱减法的特征参数CS-SSMFCC,提高了系统的鲁棒性。将时频分析特性较好的小波阈值去噪应用到系统前端,发现小波软阈值去噪效果比谱减法更好,在15dB信噪比下,识别率可以达到90%以上。(3)语音信号是由激励源和声道函数共同作用的结果,基于行阶梯矩阵提取另一种关键特征参数—基音频率。为了提高识别率,提出一种将基音信息和Mel倒谱特征分数层线性加权融合方法,根据加权系数是否与每条测试语音有关,采用固定加权和动态加权两种融合方法,实验结果表明动态加权融合识别效果更好。在此基础上,将小波软阈值去噪增加到系统前端,设计一种新的抗噪融合识别系统,增强了系统的鲁棒性。
【关键词】:说话人识别 鲁棒性 压缩感知 语音增强 加权融合
【学位授予单位】:南京邮电大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN912.34
【目录】:
- 摘要4-5
- Abstract5-9
- 专用术语注释表9-10
- 第一章 绪论10-17
- 1.1 引言10-11
- 1.2 说话人识别技术11-15
- 1.2.1 说话人识别的发展历程12-13
- 1.2.2 说话人识别中的问题13-14
- 1.2.3 说话人识别的应用14-15
- 1.3 基于CS的说话人识别技术研究现状15
- 1.4 论文内容和结构安排15-17
- 第二章 说话人识别技术与压缩感知理论17-37
- 2.1 说话人识别原理17
- 2.2 语音预处理17-20
- 2.3 特征参数提取20-24
- 2.4 说话人识别模型24-28
- 2.4.1 矢量量化模型(VQ)24-25
- 2.4.2 隐马尔科夫模型(HMM)25
- 2.4.3 高斯混合模型(GMM)25-27
- 2.4.4 支持向量机(SVM)27-28
- 2.5 说话人识别性能评价28-29
- 2.6 压缩感知基本理论29-35
- 2.6.1 语音信号的稀疏性30-32
- 2.6.2 观测矩阵的选取32-35
- 2.7 基于CS的识别系统框架35-36
- 2.8 本章小结36-37
- 第三章 基于压缩感知的增强型特征参数研究37-53
- 3.1 引言37
- 3.2 基于CS的增强型识别系统37-38
- 3.3 有噪环境下基于CS的说话人识别38-47
- 3.3.1 行阶梯观测矩阵39-41
- 3.3.2 基于谱减法的特征提取41-43
- 3.3.3 基于小波阈值去噪法的特征提取43-47
- 3.4 实验结果与分析47-51
- 3.4.1 实验一:压缩比与识别率的关系47-48
- 3.4.2 实验二:帧长对识别率的影响48-49
- 3.4.3 实验三:有噪环境下输出信噪比对比49-50
- 3.4.4 实验四:有噪环境下特征参数性能对比50-51
- 3.5 本章小结51-53
- 第四章 基于压缩感知信息融合的说话人识别系统53-69
- 4.1 引言53-54
- 4.2 基于CS的基音特征提取54-57
- 4.3 基于CS的倒谱特征提取57
- 4.4 两种特征信息融合方法研究57-63
- 4.4.1 匹配分数线性融合的具体过程58-59
- 4.4.2 固定权重融合方法59-60
- 4.4.3 动态权重融合方法60-62
- 4.4.4 有噪环境下信息融合的说话人识别系统62-63
- 4.5 实验结果及分析63-67
- 4.5.1 实验一:单一特征识别率63-65
- 4.5.2 实验二:特征融合后的识别率65-66
- 4.5.3 实验三:噪声环境下融合系统识别效果66-67
- 4.6 本章小结67-69
- 第五章 总结与展望69-71
- 5.1 论文总结69-70
- 5.2 工作展望70-71
- 参考文献71-75
- 附录1 攻读硕士学位期间撰写的论文75-76
- 附录2 攻读硕士学位期间参加的科研项目76-77
- 致谢77
【相似文献】
中国期刊全文数据库 前10条
1 石艳;王晓晔;;新颖检测法在说话人识别技术中的应用[J];现代计算机(专业版);2008年07期
2 刘雪燕;张娜;袁宝玲;;说话人识别综述[J];电脑知识与技术;2009年01期
3 邱政权;范小春;王俊年;;基于动态环境下的说话人识别[J];科学技术与工程;2010年02期
4 单进;;说话人识别技术研究[J];科技资讯;2010年21期
5 申志生;于明;;说话人识别算法的定点DSP实现[J];单片机与嵌入式系统应用;2011年03期
6 谢建勋;;浅谈说话人识别技术[J];电脑知识与技术;2011年11期
7 安茂波;刘建;;一个快速说话人识别系统的设计和实现[J];网络新媒体技术;2012年03期
8 杨迪;戚银城;刘明军;张华芳子;武军娜;;说话人识别综述[J];电子科技;2012年06期
9 武光利;;说话人识别方法概述[J];硅谷;2012年19期
10 曹业敏,侯风雷,王炳锡;说话人识别技术现状与进展[J];河南科技;1998年09期
中国重要会议论文全文数据库 前10条
1 鲍福良;方志刚;徐洁;;说话人识别综述[A];第六届全国信息获取与处理学术会议论文集(2)[C];2008年
2 孙帆;迟惠生;;循环网络说话人识别[A];第二届全国人机语音通讯学术会议论文集[C];1992年
3 肖剑;欧贵文;;多层前馈神经网络组的文本无关说话人识别[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
4 张玲华;郑宝玉;杨震;;模糊超椭球聚类算法及其在说话人识别中的应用研究[A];第八届全国人机语音通讯学术会议论文集[C];2005年
5 王宏;潘金贵;;基于矩阵正态分布的文本有关说话人识别[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
6 戴红霞;赵力;;文本无关说话人识别系统的研究[A];2007’促进西部发展声学学术交流会论文集[C];2007年
7 陈联武;郭武;戴礼荣;;说话人识别系统中多样训练的应用[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
8 崔玉红;胡光锐;;基于神经网络特征维数压缩方法及其在说话人识别中的应用[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
9 吴丽丽;;基于仿生模式识别的说话人识别学习模型研究[A];第二届中国科学院博士后学术年会暨高新技术前沿与发展学术会议程序册[C];2010年
10 张晶;董金明;冯文全;;说话人识别系统研究与实现[A];全国第二届信号处理与应用学术会议专刊[C];2008年
中国重要报纸全文数据库 前2条
1 汪永安;科大讯飞说话人识别技术世界领先[N];安徽日报;2008年
2 吴长锋;科大讯飞勇夺说话人识别国际大赛第一[N];科技日报;2008年
中国博士学位论文全文数据库 前10条
1 单振宇;情感说话人识别及其解决方法的研究[D];浙江大学;2010年
2 别凡虎;说话人识别中区分性问题的研究[D];清华大学;2015年
3 谢怡宁;基于稀疏编码的鲁棒说话人识别方法研究[D];哈尔滨理工大学;2016年
4 陆伟;基于缺失特征的文本无关说话人识别鲁棒性研究[D];中国科学技术大学;2008年
5 刘镝;说话人识别中信息融合算法的研究[D];北京交通大学;2011年
6 付中华;说话人识别系统鲁棒性研究[D];西北工业大学;2004年
7 林琳;基于模糊聚类与遗传算法的说话人识别理论研究及应用[D];吉林大学;2007年
8 邱政权;在噪声环境下的说话人识别[D];华南理工大学;2007年
9 郭武;复杂信道下的说话人识别[D];中国科学技术大学;2007年
10 钱博;基于汉语元音映射的说话人识别技术研究[D];南京理工大学;2007年
中国硕士学位论文全文数据库 前10条
1 丛菡菡;基于支持相量机的稳键说话人识别[D];电子科技大学;2008年
2 任舒彬;面向手持应用的说话人识别算法研究[D];浙江大学;2006年
3 申志生;文本相关说话人识别嵌入式系统及其关键技术研究[D];河北工业大学;2011年
4 汪q,
本文编号:734267
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/734267.html