当前位置:主页 > 科技论文 > 网络通信论文 >

基于GMM与改进LS-SVM算法的说话人识别研究

发布时间:2017-07-30 15:21

  本文关键词:基于GMM与改进LS-SVM算法的说话人识别研究


  更多相关文章: 说话人识别 高斯混合模型 支持向量机 稀疏算法 模糊算法


【摘要】:语音信号中包含着许多信息,例如语音的内容、语音的语种、说话人的性别和身份信息等。说话人识别技术是将语音信号中表明说话人身份的特征提取出来,再利用这些特征来辨别说话人身份的技术。说话人识别不但具有不会遗忘、不需记忆、使用方便等优点,还有其独特的优势,如:传感器成本低、非接触性、可用于远程验证等,已经逐渐发展成生物认证领域的关键技术。最小二乘支持向量机是说话人识别系统中运用较广泛的一种方法,其本质上是标准支持向量机的一种改进形式,优势在于样本训练速度快、有效克服“维数灾难”问题以及易于实现。不过,由于其不具备标准支持向量机解的稀疏性性质,所以导致系统复杂度变大同时影响识别效率,针对这个问题进行研究,提出将高斯混合模型与改进最小二乘支持向量机结合的方法。首先,对最小二乘支持向量机进行深入研究,并且将其运用到说话人识别系统中,避免对先验知识的需求以及“欠学习”、“过学习”情况的出现。然后,考虑解决系统的学习能力以及抗噪能力的问题,重点研究选择模型参数的方法,采用K折方法对参数进行优化。紧接着,引入K均值预选算法及快速剪枝算法,并将其与最小二乘支持向量机结合起来,用以弥补最小二乘支持向量机解的稀疏性不足的问题。最后,考虑常用的多分类算法存在无法分割的区域,将模糊算法与稀疏最小二乘支持向量机结合。实验中对矢量量化方法、对数似然度方法以及标准支持向量机方法进行比较,结果显示在综合考虑算法效率以及识别率时,支持向量机效果最好,紧接着在不同大小语音样本库前提下,将标准支持向量机、最小二乘支持向量机以及稀疏最小二乘支持向量机的多项指标作对比,可以得出稀疏最小二乘支持向量机算法效率及识别率有所改进,最后将稀疏最小二乘支持向量机与模糊最小二乘支持向量机进行比较,可知模糊最小支持向量机识别率更高。
【关键词】:说话人识别 高斯混合模型 支持向量机 稀疏算法 模糊算法
【学位授予单位】:中国科学技术大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.34
【目录】:
  • 摘要5-6
  • ABSTRACT6-11
  • 第1章 绪论11-19
  • 1.1 说话人识别的概述及应用前景11
  • 1.2 说话人识别的发展11-12
  • 1.3 说话人识别的基本问题12-17
  • 1.3.1 不同分类12-13
  • 1.3.2 系统结构13-14
  • 1.3.3 核心技术14-16
  • 1.3.4 系统的评测指标16-17
  • 1.4 本文主要研究内容17-19
  • 第2章 语音信号处理19-31
  • 2.1 语音信号预处理19-23
  • 2.1.1 预加重19-20
  • 2.1.2 加窗处理20
  • 2.1.3 端点检测20-23
  • 2.2 倒谱分析23-24
  • 2.3 提取特征参数24-29
  • 2.4 本章小结29-31
  • 第3章 说话人模型建立31-49
  • 3.1 矢量量化模型31-39
  • 3.1.1 矢量量化的基本原理31-33
  • 3.1.2 矢量量化的失真测度33-35
  • 3.1.3 码本的设计35-39
  • 3.2 高斯混合模型39-47
  • 3.2.1 高斯混合模型的训练40-41
  • 3.2.2 通用背景模型41-45
  • 3.2.3 最大后验概率估计45-46
  • 3.2.4 均值超向量46-47
  • 3.3 本章小结47-49
  • 第4章 说话人模型识别49-67
  • 4.1 统计学习理论49-51
  • 4.1.1 VC维49
  • 4.1.2 结构风险最小化49-51
  • 4.2 支持向量机51-57
  • 4.2.1 最优分类面51-53
  • 4.2.2 核函数53-54
  • 4.2.3 多类分类54-56
  • 4.2.4 LIBSVM的应用56-57
  • 4.3 最小二乘支持向量机57-60
  • 4.3.1 最小二乘支持向量机基本概念57-58
  • 4.3.2 稀疏最小二乘支持向量机58-59
  • 4.3.3 模糊最小二乘支持向量机59-60
  • 4.4 支持向量机在说话人识别中的应用60-63
  • 4.4.1 支持向量机的应用60
  • 4.4.2 最小二乘支持向量机的应用60-61
  • 4.4.3 稀疏最小二乘支持向量机的应用61-62
  • 4.4.4 模糊最小二乘支持向量机的应用62-63
  • 4.5 对数似然得分63-64
  • 4.6 模型参数选择方法64-65
  • 4.7 本章小结65-67
  • 第5章 实验与分析67-73
  • 5.1 实验数据库67
  • 5.2 实验环境与性能指标67-68
  • 5.3 实验设计68-72
  • 5.3.1 不同识别方法的性能对比68-69
  • 5.3.2 三种SVMs算法比较实验69-71
  • 5.3.3 模糊LS-SVM与稀疏LS-SVM对比71-72
  • 5.4 本章小结72-73
  • 第6章 总结与展望73-75
  • 参考文献75-79
  • 致谢79-81
  • 在读期间发表的学术论文与取得的其他研究成果81

【参考文献】

中国硕士学位论文全文数据库 前1条

1 孙望;语音识别技术的研究及其在发音错误识别系统中的应用[D];南京航空航天大学;2008年



本文编号:594911

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/594911.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户fc3b7***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com