基于GMM-SVM说话人识别的信道算法研究
本文关键词:基于GMM-SVM说话人识别的信道算法研究,由笔耕文化传播整理发布。
【摘要】:人与人之间相互交流沟通的直接方式是语音,语音信号传播各种有效信息,是承载信息的媒介有着多层次的研究价值。语音作为人类的直接交流工具,由于不同人发音器官等的差异以及后天环境所引起的特性,使得其成为身份识别的重要工具。语音信号携带者说话人特有的差异特征信息,传达了说话人的语义内容,并且还包含了人物本身特定的生理特性、心情等重要的个人信息,使得研究并利用其特性进行实际应用具有很高的价值。随着越来越多的科研工作者致力于语音识别相关领域,其应用更加广泛。 说话人识别属于生物识别的一种,通过音频信号提取相应的特征信息作为说话人的个性特征,并应用数学理论对其进行分析,从而达到身份识别的目的。说话人识别以人所发出的语音信号为出发点,从而决定了其相对廉价及易于应用的特性。特征信号的提取只需要简单的音频输入设备即可,也使得其更容易被广泛应用和接受。在说话人识别取得较大进展的时下而言,该技术大规模地应用仍然需要解决相当多的问题,随着越来越多的研究人员参与其中,逐渐成为了当前的研究热点。 随着说话人识别技术的不断发展,研究人员提出多种语音特征参数,并且将动态时间规整算法、矢量量化、隐马尔可夫链等用于说话人识别。论文结合了高斯混合模型(Gaussian Mixture Model, GMM)及支持向量机(Support Vector Machine, SVM),建立了GMM-SVM说话人识别的基础算法,其相对于以往的算法其具有更好的数据表征能力,更优秀的分类性能,更好的识别效率。通过进一步研究发现其识别率进一步提高受到信道因素影响较为严重。为了弥补GMM-SVM说话人识别的这一缺点,,本文对特征级与模型级信道补偿技术进行了研究: 1、特征级信道处理中,针对说话人语音信号特征易受到加性噪声及线性信道干扰而引起失配这一问题,本文提出了采用特征弯折技术对语音特征数据进行处理。特征弯折应用累积分布函数的原理把说话人的特征向量变为标准分布的特征序列,增强语音特征对于信道的鲁棒性及说话人识别抗噪声性能,在渐变的噪声环境及信道失配情形下都能获得较好的鲁棒性。特征弯折作为特征归一化方法应用于说话人识别中,提高了说话人识别的信道鲁棒性,加强其对于不同应用环境的适应性能,从而提高说话人识别的性能与准确性。 2、说话人模型是通过与信道相关的说话人特征矢量建立的,其模型中不可避免的有着信道信息分量的干扰,影响说话人识别的准确率。针对这一问题,本文提出了采用因子分析算法从说话人模型分离出说话人空间,信道空间及各自分别对应的特征向量,消除其倒谱特征中存在的冗余分量。通过将隐藏在观测数据表面之下的说话人及信道信息分离,得到相应的特征空间及特征矢量,最终获得信道无关的说话人模型数据作为支持向量机的训练数据。实验结果表明,应用了因子分析技术模型级信道补偿算法的GMM-SVM的说话人识别方法在识别效率上超过了传统的GMM-SVM方法,具有更好的信道鲁棒性。 实验结果证明算法性能得到了一定提升。特征弯折算法有效的降低了信道因素对于倒谱特征的干扰,减小了信号畸变对于说话人识别性能的影响,提高了识别效果。因子分析技术对信道因子进行估计并消除,降低信道因素对于说话人模型的影响,提高了算法的性能。
【关键词】:高斯混合模型 支持向量机 因子分析 说话人识别
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.34
【目录】:
- 摘要4-6
- Abstract6-11
- 第1章 绪论11-15
- 1.1 研究背景及意义11-12
- 1.2 国内外研究现状12-13
- 1.3 研究工作概述13-14
- 1.4 论文组织结构14-15
- 第2章 说话人识别理论15-25
- 2.1 说话人识别概述15-18
- 2.1.1 说话人识别的基本方法16-18
- 2.2 GMM 说话人识别18-21
- 2.2.1 高斯混合模型18-19
- 2.2.2 GMM 参数估计19-20
- 2.2.3 GMM 说话人识别20-21
- 2.3 GMM-SVM 说话人识别21-25
- 2.3.1 基于 GMM-SVM 的说话人识别算法23-25
- 第3章 基于特征弯折的特征级信道鲁棒性算法研究25-35
- 3.1 特征级信道鲁棒性算法25-27
- 3.1.1 倒谱均值减25
- 3.1.2 倒谱方差归一化25-26
- 3.1.3 特征映射26
- 3.1.4 特征弯折26-27
- 3.2 基于特征弯折的信道补偿算法27-30
- 3.3 基于特征弯折的 GMM-SVM 说话人识别30-31
- 3.4 实验结果与分析31-35
- 3.4.1 实验结果对比32-33
- 3.4.2 分析及结论33-35
- 第4章 基于因子分析的模型级信道补偿算法研究35-50
- 4.1 模型级信道补偿35-41
- 4.1.1 冗余属性映射36
- 4.1.2 说话人模型合成36-38
- 4.1.3 基于鉴别性向量的信道补偿38-39
- 4.1.4 基于因子分析的信道补偿39-41
- 4.2 基于因子分析的信道补偿算法41-45
- 4.2.1 因子分析模型42-43
- 4.2.2 因子分析算法43-45
- 4.3 基于因子分析的 GMM-SVM 说话人识别45-46
- 4.4 实验结果与分析46-50
- 第5章 总结与展望50-52
- 5.1 工作总结50-51
- 5.2 研究展望51-52
- 参考文献52-55
- 作者简介及在学期间所取得的科研成果55-56
- 致谢56
【参考文献】
中国期刊全文数据库 前10条
1 刘雪燕;张娜;袁宝玲;;说话人识别综述[J];电脑知识与技术;2009年01期
2 何金鑫;康凯;关胜晓;;与文本无关的声纹识别系统的研究[J];电子技术;2013年02期
3 李俊颉;葛良全;涂小芳;;说话人识别系统的实现[J];电子制作;2014年05期
4 魏君颖;魏维;;说话人识别特征提取算法改进[J];成都信息工程学院学报;2014年S1期
5 黄奋;马皓;邓菁;;说话人识别技术在社保系统中的远程身份认证应用研究[J];电子技术与软件工程;2014年02期
6 沈思秋;吕勇;杨芸;齐彦云;;基于说话人特有特征集的GMM和i-矢量方法的说话人识别[J];电子设计工程;2014年23期
7 林琳;陈虹;陈建;金焕梅;;基于多核SVM-GMM的短语音说话人识别[J];吉林大学学报(工学版);2013年02期
8 赵玉晓;顾秀秀;张二华;;与文本无关说话人识别[J];计算机与数字工程;2014年02期
9 栗志意;张卫强;何亮;刘加;;基于核函数的IVEC-SVM说话人识别系统研究[J];自动化学报;2014年04期
10 李壮辉;;基音特征融合高斯混合模型的说话人识别研究[J];测控技术;2014年06期
中国博士学位论文全文数据库 前2条
1 蒋晔;基于短语音和信道变化的说话人识别研究[D];南京理工大学;2013年
2 王琳琳;说话人识别中的时变鲁棒性问题研究[D];清华大学;2013年
本文关键词:基于GMM-SVM说话人识别的信道算法研究,由笔耕文化传播整理发布。
本文编号:359745
本文链接:https://www.wllwen.com/kejilunwen/wltx/359745.html