说话人识别中特征组合方法的研究
本文关键词:说话人识别中特征组合方法的研究
更多相关文章: 说话人识别 特征提取 Fisher准则 GMM BP神经网络
【摘要】:说话人识别是一种生物认证技术,研究的是如何根据人的语音中独有的个性特点,来自动识别说话人身份。目前,凭借其特有的便利性、经济性和正确性,已在某些领域得到应用,是语音处理的一个研究热点,其两个关键部分是说话人特征提取和识别模型建立。本文重点研究了说话人识别的特征组合方法,主要工作如下:(1)在线性预测系数(LPC)和美尔频率倒谱系数(MFCC)基础上,将LPC系数融入到MFCC参数中,得到线性预测美尔倒谱系数(LPMFCC),用于说话人识别。该方法不会增加特征维数,运算量也相对较少,识别率有较大程度提高。(2)为提高说话人识别的正确率,同时采用多个特征参数。针对综合特征参数中各维分量对识别结果的影响可能不一样,同等对待并不一定是最优的方案这个问题,提出基于Fisher准则的MFCC、LPMFCC、Teager能量算子倒谱参数(TEOCC)相混合的特征参数提取方法(FMLT参数),该方法有效地结合了人耳的感知、声道和非线性能量方面的特征;另外,提出一种采用改进的升半正弦函数进行加权的组合特征参数(WFMLT参数)。为验证这两种方法的有效性,提出基于PCA的MFCC、LPMFC和TEOCC组合特征参数提取方法(PCMLT参数)进行对比分析。(3)针对MFCC参数在中高频的计算精度不高的问题,采用滤波器组主要分布在高频部分的翻转美尔倒谱参数(IMFCC)和滤波器组主要分布在中频部分的中频美尔倒谱参数(MidMFCC)相结合的方法,提出基于Fisher比的MFCC、IMFCC和Mid MFCC的组合特征参数(FMFCC参数),来改善说话人识别系统性能。(4)研究基于GMM和BP神经网络的说话人识别系统,将上述特征参数提取方法分别应用到系统中,验证组合特征参数的有效性和可行性以及系统的识别性能。仿真实验表明,FMLT方法与MFCC、LPMFCC、MFCC+LPMFCC、FMFCC以及PCMLT方法相比,识别率在纯净语音环境下分别提高了21.65%、18.39%、15.61%、15.01%与22.70%;在30dB噪声环境下,则分别提升了15.15%、10.81%、8.69%、7.64%与17.76%;并且经加权处理的WFMLT方法的识别性能更优于FMLT方法,在纯净语音环境下提升了2.62%。结果表明,FMLT和WFMLT参数能够有效提高说话人识别率,且具有更好的鲁棒性。
【关键词】:说话人识别 特征提取 Fisher准则 GMM BP神经网络
【学位授予单位】:湘潭大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN912.34
【目录】:
- 摘要4-5
- Abstract5-9
- 第1章 绪论9-13
- 1.1 研究背景及意义9-10
- 1.2 说话人识别研究现状10-11
- 1.3 说话人识别研究难点11
- 1.4 本文的主要工作及内容结构安排11-13
- 1.4.1 主要工作11-12
- 1.4.2 内容结构安排12-13
- 第2章 说话人识别概述13-24
- 2.1 说话人识别原理13-16
- 2.2 说话人识别预处理16-21
- 2.2.1 预加重16-17
- 2.2.2 分帧加窗17-19
- 2.2.3 端点检测19-21
- 2.3 说话人识别模型21-23
- 2.3.1 模板匹配模型21-22
- 2.3.2 概率统计模型22
- 2.3.3 人工神经网络22-23
- 2.4 本章小结23-24
- 第3章 说话人识别特征参数组合方法24-38
- 3.1 LPC系数24-26
- 3.2 MFCC参数26-28
- 3.3 LPCMFCC参数28-29
- 3.4 TEOCC参数29-30
- 3.5 基于Fisher比的组合特征参数30-35
- 3.5.1 Fisher准则31
- 3.5.2 基于Fisher比的MFCC、LPMFCC和TEOCC组合特征参数31-32
- 3.5.3 基于Fisher比的MFCC、LPMFCC和TEOCC加权组合特征参数32-33
- 3.5.4 基于Fisher比的MFCC组合特征参数33-35
- 3.6 基于PCA的组合特征参数35-36
- 3.6.1 主分量分析35-36
- 3.6.2 基于PCA的MFCC、LPMFCC和TEOCC组合特征参数36
- 3.7 本章小结36-38
- 第4章 基于GMM的说话人识别系统38-48
- 4.1 高斯混合模型的基本概念38-39
- 4.2 高斯混合模型的参数估计39-41
- 4.3 基于GMM的说话人识别系统41-42
- 4.4 仿真实验及结果分析42-46
- 4.4.1 语音库及参数设置42
- 4.4.2 实验结果及分析42-46
- 4.5 本章小结46-48
- 第5章 基于BP神经网络的说话人识别系统48-52
- 5.1 BP神经网络基本概念48-49
- 5.2 基于BP神经网络的说话人识别系统49-50
- 5.3 仿真实验及结果分析50-51
- 5.3.1 语音库及参数设置50
- 5.3.2 实验结果及分析50-51
- 5.4 本章小结51-52
- 第6章 总结与展望52-54
- 6.1 总结52
- 6.2 展望52-54
- 参考文献54-58
- 致谢58-59
- 附录A 个人简历59-60
- 附录B 攻读学位期间发表的论文60-61
- 附录C 论文中的用图61-62
- 附录D 论文中的用表62
【相似文献】
中国期刊全文数据库 前10条
1 石艳;王晓晔;;新颖检测法在说话人识别技术中的应用[J];现代计算机(专业版);2008年07期
2 刘雪燕;张娜;袁宝玲;;说话人识别综述[J];电脑知识与技术;2009年01期
3 邱政权;范小春;王俊年;;基于动态环境下的说话人识别[J];科学技术与工程;2010年02期
4 单进;;说话人识别技术研究[J];科技资讯;2010年21期
5 申志生;于明;;说话人识别算法的定点DSP实现[J];单片机与嵌入式系统应用;2011年03期
6 谢建勋;;浅谈说话人识别技术[J];电脑知识与技术;2011年11期
7 安茂波;刘建;;一个快速说话人识别系统的设计和实现[J];网络新媒体技术;2012年03期
8 杨迪;戚银城;刘明军;张华芳子;武军娜;;说话人识别综述[J];电子科技;2012年06期
9 武光利;;说话人识别方法概述[J];硅谷;2012年19期
10 曹业敏,侯风雷,王炳锡;说话人识别技术现状与进展[J];河南科技;1998年09期
中国重要会议论文全文数据库 前10条
1 鲍福良;方志刚;徐洁;;说话人识别综述[A];第六届全国信息获取与处理学术会议论文集(2)[C];2008年
2 孙帆;迟惠生;;循环网络说话人识别[A];第二届全国人机语音通讯学术会议论文集[C];1992年
3 肖剑;欧贵文;;多层前馈神经网络组的文本无关说话人识别[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
4 张玲华;郑宝玉;杨震;;模糊超椭球聚类算法及其在说话人识别中的应用研究[A];第八届全国人机语音通讯学术会议论文集[C];2005年
5 王宏;潘金贵;;基于矩阵正态分布的文本有关说话人识别[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
6 戴红霞;赵力;;文本无关说话人识别系统的研究[A];2007’促进西部发展声学学术交流会论文集[C];2007年
7 陈联武;郭武;戴礼荣;;说话人识别系统中多样训练的应用[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
8 崔玉红;胡光锐;;基于神经网络特征维数压缩方法及其在说话人识别中的应用[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
9 吴丽丽;;基于仿生模式识别的说话人识别学习模型研究[A];第二届中国科学院博士后学术年会暨高新技术前沿与发展学术会议程序册[C];2010年
10 张晶;董金明;冯文全;;说话人识别系统研究与实现[A];全国第二届信号处理与应用学术会议专刊[C];2008年
中国重要报纸全文数据库 前2条
1 汪永安;科大讯飞说话人识别技术世界领先[N];安徽日报;2008年
2 吴长锋;科大讯飞勇夺说话人识别国际大赛第一[N];科技日报;2008年
中国博士学位论文全文数据库 前10条
1 单振宇;情感说话人识别及其解决方法的研究[D];浙江大学;2010年
2 别凡虎;说话人识别中区分性问题的研究[D];清华大学;2015年
3 谢怡宁;基于稀疏编码的鲁棒说话人识别方法研究[D];哈尔滨理工大学;2016年
4 陆伟;基于缺失特征的文本无关说话人识别鲁棒性研究[D];中国科学技术大学;2008年
5 刘镝;说话人识别中信息融合算法的研究[D];北京交通大学;2011年
6 付中华;说话人识别系统鲁棒性研究[D];西北工业大学;2004年
7 林琳;基于模糊聚类与遗传算法的说话人识别理论研究及应用[D];吉林大学;2007年
8 邱政权;在噪声环境下的说话人识别[D];华南理工大学;2007年
9 郭武;复杂信道下的说话人识别[D];中国科学技术大学;2007年
10 钱博;基于汉语元音映射的说话人识别技术研究[D];南京理工大学;2007年
中国硕士学位论文全文数据库 前10条
1 丛菡菡;基于支持相量机的稳键说话人识别[D];电子科技大学;2008年
2 任舒彬;面向手持应用的说话人识别算法研究[D];浙江大学;2006年
3 申志生;文本相关说话人识别嵌入式系统及其关键技术研究[D];河北工业大学;2011年
4 汪q,
本文编号:789856
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/789856.html