当前位置:主页 > 科技论文 > 网络通信论文 >

基于特征组合的说话人识别研究

发布时间:2017-04-12 18:02

  本文关键词:基于特征组合的说话人识别研究,由笔耕文化传播整理发布。


【摘要】:说话人识别是一项根据说话人的声音信号提取出表征说话人个性的特征参数来自动识别说话人身份的生物认证技术。因其独特的方便性、经济性、准确性,被广泛应用在信息安全、通信、司法、军事等各种需要安全认证的领域。说话人识别的两个关键部分是特征提取和模式匹配,而大量的研究表明,说话人识别的问题主要是来自于说话人的特征提取上,因此,本文在对说话人识别系统的基本原理进行了分析和研究的基础上,重点研究说话人的特征提取,主要工作如下:(1)线性预测系数(LPC)和梅尔频率倒谱系数(MFCC)是说话人识别中最常用的两种特征参数,将这两种参数组合,虽然在一定程度上提高了识别率,但却增加了特征参数的维数,使得计算量加大。针对此问题,本文提出将LPC系数融入到MFCC系数的计算里的特征提取方法,该方法首先计算语音信号的LPC系数,求出LPC功率谱;然后将LPC功率谱通过三角形滤波器组,并取对数;最后将对数后的输出做离散余弦变换,得到新的特征参数:线性预测梅尔频率倒谱系数(LPMFCC)。LPMFCC参数兼具LPC参数的声道特性和MFCC参数的听觉特性,虽增加了一步计算,但不增加参数的维数,运算量相对较少。将LPMFCC方法分别应用到基于VQ和基于GMM的说话人识别系统中进行实验仿真。实验结果表明,本文提出的LPMFCC方法在纯净语音环境下在基于VQ的说话人识别系统中,较LPC方法和MFCC方法识别率能提高18.57%和10.00%;在基于GMM的说话人识别系统中,与LPC方法和MFCC方法相比,识别率也分别提高了11.72%和2.00%,在不同噪声环境下LPMFCC方法的识别性能均明显改善。(2)Mel滤波器组在低频区域分布密集,在高频区域分布稀疏,使得MFCC系数忽略了高频信息。针对此不足,采用将Mel滤波器组进行翻转,得到翻转梅尔频率倒谱系数IMFCC的方法。利用MFCC系数和IMFCC系数的互补特点,讨论MFCC和IMFCC特征的融合在系统中的应用,首先将两者分别输入到同一种分类器中,得到各自的匹配得分,然后将两者得分加权融合得到融合匹配分数,最后做出判决。通过实验仿真,验证了此方法的有效性。(3)研究说话人识别技术实用化的问题。初步实现了基于DSP的说话人确认系统,该系统以开发板上的LED灯确定说话人的身份,如果LED灯亮,表明是本人的语音,而如果LED灯不亮,则说明并不是本人的语音。
【关键词】:说话人识别 线性预测系数 梅尔频率倒谱系数 矢量量化 高斯混合模型
【学位授予单位】:湘潭大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.34
【目录】:
  • 摘要4-5
  • Abstract5-9
  • 第1章 绪论9-14
  • 1.1 说话人识别研究背景及意义9-10
  • 1.2 发展历史和现状10-11
  • 1.3 说话人识别的研究难点11-12
  • 1.4 本论文研究的主要内容和章节安排12-14
  • 1.4.1 主要内容12
  • 1.4.2 章节安排12-14
  • 第2章 说话人识别技术基础14-21
  • 2.1 说话人识别技术概述14-16
  • 2.1.1 说话人识别系统结构14
  • 2.1.2 说话人识别的分类14-15
  • 2.1.3 说话人识别系统性能评价15-16
  • 2.2 说话人识别预处理16-19
  • 2.2.1 预加重16-17
  • 2.2.2 加窗分帧17
  • 2.2.3 端点检测17-19
  • 2.3 说话人识别模式匹配方法19-20
  • 2.3.1 基于模板匹配模型的方法19
  • 2.3.2 基于概率统计模型的方法19
  • 2.3.3 基于人工神经网络的方法19-20
  • 2.4 本章小结20-21
  • 第3章 说话人识别的特征组合方法研究21-30
  • 3.1 线性预测系数21-24
  • 3.2 MFCC系数的提取24-26
  • 3.3 LPMFCC系数的提取26-27
  • 3.4 基于MFCC与IMFCC系数的说话人识别研究27-29
  • 3.4.1 IMFCC系数的提取27-28
  • 3.4.2 MFCC与IMFCC系数的组合方法研究28-29
  • 3.5 本章小结29-30
  • 第4章 基于VQ的说话人识别系统研究30-39
  • 4.1 矢量量化的基本原理30-31
  • 4.2 LBG算法31-32
  • 4.3 初始码本的选定32-33
  • 4.4 基于VQ的说话人识别系统33-34
  • 4.5 实验结果与分析34-38
  • 4.5.1 融合LPC系数和MFCC系数实验结果分析34-35
  • 4.5.2 组合MFCC参数和IMFCC参数实验结果分析35-38
  • 4.6 本章小结38-39
  • 第5章 基于GMM的说话人识别系统研究39-49
  • 5.1 高斯混合模型的基本概念39-40
  • 5.2 高斯混合模型的参数估计40-43
  • 5.3 基于GMM的说话人识别系统43-44
  • 5.3.1 系统基本机构43
  • 5.3.2 GMM模型的识别问题43-44
  • 5.4 实验结果与分析44-47
  • 5.4.1 融合LPC系数和MFCC系数实验结果分析44-45
  • 5.4.2 组合MFCC参数和IMFCC参数实验结果分析45-47
  • 5.5 本章小结47-49
  • 第6章 应用DSP进行说话人识别的软件设计49-53
  • 6.1 DSP集成开发环境CCS49-51
  • 6.2 说话人识别的DSP程序流程51-52
  • 6.3 系统测试及相关结果52
  • 6.4 本章小结52-53
  • 第7章 总结与展望53-55
  • 7.1 工作总结53-54
  • 7.2 未来展望54-55
  • 参考文献55-58
  • 致谢58-59
  • 附录A 个人简历59-60
  • 附录B 攻读学位期间发表的论文60-61
  • 附录C 论文中的用图61-62
  • 附录D 论文中的用表62

【参考文献】

中国硕士学位论文全文数据库 前1条

1 孙鹏;基于GMM算法的说话人识别系统的研究[D];东北林业大学;2014年


  本文关键词:基于特征组合的说话人识别研究,,由笔耕文化传播整理发布。



本文编号:301818

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/301818.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户7e40b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com