基于GMM-UBM模型的说话人识别系统
本文关键词:基于GMM-UBM模型的说话人识别系统
更多相关文章: 说话人识别 特征提取 GMM-UBM MFCC
【摘要】:说话人识别技术通过提取语音中的一些有用信息作为特征,建立模型来识别说话人的身份。最近几十年,科技发展迅猛,在人们生活目益方便的同时,安全问题也越来越严重,身份验证必须更加安全有效才能保证人们的财产和人身安全。而说话人识别技术所需成本低并且特征容易提取以及方便扩展等优势,所以可以应用于多个领域,比如计算机远程登录、门禁系统、数据库访问等等。近些年来,说话人识别已然成为了语音识别中热门研究方向之一。在众多的说话人识别技术中,本文主要进行基于梅尔倒谱特征提取方法和GMM-UBM模型的研究。论文主要研究内容如下:(1)介绍与分析了说话人识别的研究目的、背景以及意义,对说话人识别在国内外的发展历史和近况以及在实际中的应用进行了介绍和分析;(2)对说话人识别的分类、识别的流程、常用的方法等等进行了介绍,分析了几种特征提取方法以及系统识别方法,并给出它的评价方法的公式与流程;(3)从语音的发声原理讲起,研究了语音特征提取的各个步骤,介绍了梅尔倒谱特征、动态特征、短时归一化能量的提取,并进行实验验证了动态特征以及短时归一化能量的作用;(4)重点介绍了GMM-UBM模型的实现,对于实现该模型的EM算法、K-means算法等也进行了分析,并进行实验对于模型的各种参数变化进行了对比,得出最优的结果。
【关键词】:说话人识别 特征提取 GMM-UBM MFCC
【学位授予单位】:内蒙古大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN912.34
【目录】:
- 摘要4-5
- ABSTRACT5-12
- 第一章 绪论12-15
- 1.1 说话人识别的研究目的与意义12
- 1.2 说话人识别的发展历史和研究现状12-14
- 1.3 存在的问题14
- 1.4 本文的主要内容及安排14-15
- 第二章 说话人识别简介15-22
- 2.1 说话人识别分类15
- 2.2 说话人识别的原理和结构15-16
- 2.3 说话人识别的特征提取16-17
- 2.3.1 特征提取的原则16
- 2.3.2 特征提取的原则16-17
- 2.4 说话人识别的建模方法17-19
- 2.4.1 模板匹配17-18
- 2.4.2 概率统计模型18
- 2.4.3 人工神经网络18-19
- 2.4.4 融合方法19
- 2.5 说话人识别的性能评价指标19-22
- 2.5.1 说话人辨认19
- 2.5.2 说话人确认19-20
- 2.5.3 实际应用的要求20-22
- 第三章 语音信号处理及特征提取22-36
- 3.1 语音信号的产生22-23
- 3.1.1 语音信号的产生机理22-23
- 3.1.2 语音产生的数学模型23
- 3.2 语音信号的预处理23-26
- 3.2.1 采样与量化23-24
- 3.2.2 归一化24
- 3.2.3 预加重24-25
- 3.2.4 分帧与加窗25-26
- 3.3 语音信号的时域分析26-29
- 3.3.1 短时平均能量26-27
- 3.3.2 短时平均过零率27-28
- 3.3.3 语音信号的端点检测28-29
- 3.4 语音信号的频域分析29-30
- 3.4.1 短时傅立叶变换29
- 3.4.2 语谱图29-30
- 3.5 语音信号的同态倒谱分析30-31
- 3.5.1 倒谱和复倒谱30
- 3.5.2 线性预测系数30-31
- 3.6 语音信号特征提取31-35
- 3.6.1 线性预测倒谱系数31-32
- 3.6.2 梅尔频率倒谱系数32-34
- 3.6.3 短时归一化能量34
- 3.6.4 动态特征34-35
- 3.7 矢量特征的参数规整35-36
- 第四章 基于GMM-UBM的说话人识别36-43
- 4.1 GMM的基本原理36-39
- 4.1.1 GMM模型的原理36-37
- 4.1.2 GMM模型的参数估计37-39
- 4.1.3 GMM模型的参数初始化39
- 4.2 GMM-UBM模型39-43
- 4.2.1 UBM在说话人识别中的应用39-40
- 4.2.2 MAP算法40-41
- 4.2.3 GMM-UBM的对数似然比41-43
- 第五章 系统实现与实验结果43-50
- 5.1 说话人识别系统平台43-45
- 5.1.1 硬件平台43
- 5.1.2 软件平台43
- 5.1.3 系统功能与模块43-45
- 5.2 高斯混合密度个数对系统的影响45-46
- 5.3 语音长度对系统影响46-47
- 5.3.1 训练语音长度对系统影响46-47
- 5.3.2 测试语音长度对系统影响47
- 5.4 特征维数对系统影响47-48
- 5.5 端点检测对系统影响48-49
- 5.6 GMM模型与GMM-UBM模型的比较49
- 5.7 实验结果49-50
- 第六章 总结与展望50-52
- 6.1 主要结论50
- 6.2 待研究的问题50-52
- 参考文献52-55
- 致谢55
【相似文献】
中国期刊全文数据库 前10条
1 石艳;王晓晔;;新颖检测法在说话人识别技术中的应用[J];现代计算机(专业版);2008年07期
2 刘雪燕;张娜;袁宝玲;;说话人识别综述[J];电脑知识与技术;2009年01期
3 邱政权;范小春;王俊年;;基于动态环境下的说话人识别[J];科学技术与工程;2010年02期
4 单进;;说话人识别技术研究[J];科技资讯;2010年21期
5 申志生;于明;;说话人识别算法的定点DSP实现[J];单片机与嵌入式系统应用;2011年03期
6 谢建勋;;浅谈说话人识别技术[J];电脑知识与技术;2011年11期
7 安茂波;刘建;;一个快速说话人识别系统的设计和实现[J];网络新媒体技术;2012年03期
8 杨迪;戚银城;刘明军;张华芳子;武军娜;;说话人识别综述[J];电子科技;2012年06期
9 武光利;;说话人识别方法概述[J];硅谷;2012年19期
10 曹业敏,侯风雷,王炳锡;说话人识别技术现状与进展[J];河南科技;1998年09期
中国重要会议论文全文数据库 前10条
1 鲍福良;方志刚;徐洁;;说话人识别综述[A];第六届全国信息获取与处理学术会议论文集(2)[C];2008年
2 孙帆;迟惠生;;循环网络说话人识别[A];第二届全国人机语音通讯学术会议论文集[C];1992年
3 肖剑;欧贵文;;多层前馈神经网络组的文本无关说话人识别[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
4 张玲华;郑宝玉;杨震;;模糊超椭球聚类算法及其在说话人识别中的应用研究[A];第八届全国人机语音通讯学术会议论文集[C];2005年
5 王宏;潘金贵;;基于矩阵正态分布的文本有关说话人识别[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
6 戴红霞;赵力;;文本无关说话人识别系统的研究[A];2007’促进西部发展声学学术交流会论文集[C];2007年
7 陈联武;郭武;戴礼荣;;说话人识别系统中多样训练的应用[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
8 崔玉红;胡光锐;;基于神经网络特征维数压缩方法及其在说话人识别中的应用[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
9 吴丽丽;;基于仿生模式识别的说话人识别学习模型研究[A];第二届中国科学院博士后学术年会暨高新技术前沿与发展学术会议程序册[C];2010年
10 张晶;董金明;冯文全;;说话人识别系统研究与实现[A];全国第二届信号处理与应用学术会议专刊[C];2008年
中国重要报纸全文数据库 前2条
1 汪永安;科大讯飞说话人识别技术世界领先[N];安徽日报;2008年
2 吴长锋;科大讯飞勇夺说话人识别国际大赛第一[N];科技日报;2008年
中国博士学位论文全文数据库 前10条
1 单振宇;情感说话人识别及其解决方法的研究[D];浙江大学;2010年
2 别凡虎;说话人识别中区分性问题的研究[D];清华大学;2015年
3 谢怡宁;基于稀疏编码的鲁棒说话人识别方法研究[D];哈尔滨理工大学;2016年
4 陆伟;基于缺失特征的文本无关说话人识别鲁棒性研究[D];中国科学技术大学;2008年
5 刘镝;说话人识别中信息融合算法的研究[D];北京交通大学;2011年
6 付中华;说话人识别系统鲁棒性研究[D];西北工业大学;2004年
7 林琳;基于模糊聚类与遗传算法的说话人识别理论研究及应用[D];吉林大学;2007年
8 邱政权;在噪声环境下的说话人识别[D];华南理工大学;2007年
9 郭武;复杂信道下的说话人识别[D];中国科学技术大学;2007年
10 钱博;基于汉语元音映射的说话人识别技术研究[D];南京理工大学;2007年
中国硕士学位论文全文数据库 前10条
1 丛菡菡;基于支持相量机的稳键说话人识别[D];电子科技大学;2008年
2 任舒彬;面向手持应用的说话人识别算法研究[D];浙江大学;2006年
3 申志生;文本相关说话人识别嵌入式系统及其关键技术研究[D];河北工业大学;2011年
4 汪q,
本文编号:968412
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/968412.html