基于声纹识别的说话人身份确认方法的研究
发布时间:2017-09-15 15:49
本文关键词:基于声纹识别的说话人身份确认方法的研究
【摘要】:声纹识别技术是一种生物认证的方法,从说话人能反映自己生理和行为个性特征的语音参数中提取出说话人是谁的信息的过程。声纹识别以其的使用灵活、经济和实用等方面的优势在很多领域中有着广泛的应用前景。本文主要对文本无关的声纹识别技术、在短时条件下的与文本相关的声纹识别技术和声纹识别技术的实际应用等方面的相关内容做出了研究。在文本无关领域,重点分析了采用最主流的技术高斯混合模型(Gaussian Mixture Model)和高斯混合模型-通用背景模型(Gaussian Mixture Model-Universal Background Model,GMM-UBM),详细介绍了两种模型的概念、参数的估计以及识别算法等基础理论,并使用QT这款跨平台C++图形用户界面应用软件,用图形用户界面设计了一个简单实用的基于GMM的与文本无关的声纹识别系统,进行了相关模型参数训练和匹配识别过程,并通过实验研究分析了GMM-UBM模型的阶数对识别性能的影响。在与文本相关的声纹识别研究中,既要包含说话人身份的识别,又要包含语音文本内容的识别。本文提出一种结合语音识别的与文本相关的声纹识别方法,从而建立说话人的声纹模型和语音文本模型,与传统的仅建立一种模型的方法相比,该方法能更精确的描述说话人身份信息和语音的文本信息,较好地解决了短时语音样本识别效果不佳的问题。测试实验表明,和传统与文本相关的声纹识别方法(如DTW、GMM-UBM)相比,在漏警概率相同的条件下,由本方法建立的系统虚警概率降低了8.9%,识别性能得到了提高。最后在熟练掌握基于GMM-UBM声纹识别系统的基础上,论文针对声纹识别技术的应用方面做出创新性探究,首先设计了一种基于声纹识别的文件夹多重加密保护系统,不仅将声纹加密的方法应用到文件夹保护,也将传统文字加密和声纹加密相结合。其次,设计了一种在Android平台下采用声纹识别模拟手机银行转账的应用软件,将个人的声纹信息来作为银行转账时的支付密码,即将声纹识别的技术应用到转账业务上,为银行的保护系统增添新的声纹密码服务,也为推动声纹识别技术的广泛应用打下坚实的基础。
【关键词】:声纹识别 文本相关 高斯混合模型 语音识别
【学位授予单位】:上海师范大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN912.34
【目录】:
- 摘要3-4
- Abstract4-8
- 第1章 绪论8-13
- 1.1 声纹识别研究背景及意义8-9
- 1.2 声纹识别研究现状和发展9-10
- 1.3 声纹识别概述10-11
- 1.3.1 声纹识别的概念10-11
- 1.3.2 声纹识别的分类11
- 1.3.3 声纹识别的基本原理和系统结构11
- 1.4 本论文的主要工作11-13
- 第2章 语音信号的特征提取13-21
- 2.1 语音信号处理基础13-15
- 2.1.1 语音信号的前期处理13-14
- 2.1.2 语音信号的端点检测14-15
- 2.2 常用声纹识别的特征参数15-20
- 2.2.1 LPCC分析16-18
- 2.2.2 MFCC参数分析18-20
- 2.3 本章小结20-21
- 第3章 基于高斯混合模型的声纹识别技术21-32
- 3.1 高斯混合模型简介21-25
- 3.1.1 GMM模型参数描述21
- 3.1.2 GMM模型参数估计21-22
- 3.1.3 模型参数初始化22-24
- 3.1.4 基于GMM的说话人确认系统24-25
- 3.2 高斯混合通用背景模型25-27
- 3.2.1 模型提出25
- 3.2.2 基于GMM-UBM模型的声纹识别系统25-27
- 3.3 声纹识别系统界面27-29
- 3.4 实验29-31
- 3.4.1 实验数据29
- 3.4.2 实验系统描述29-30
- 3.4.3 实验结果与分析30-31
- 3.5 本章小结31-32
- 第4章 结合语音识别的与文本相关的声纹识别方法32-39
- 4.1 引言32-33
- 4.2 声纹模型与语音文本模型的建立33
- 4.3 智能判定33-35
- 4.4 系统性能评价标准35
- 4.5 实验35-38
- 4.5.1 实验数据采集35-36
- 4.5.2 实验系统描述36
- 4.5.3 实验结果与分析36-38
- 4.6 本章小结38-39
- 第5章 声纹识别系统的应用与开发39-45
- 5.1 一种基于声纹识别的文件夹多重加密保护系统的设计39-42
- 5.2 采用声纹识别模拟手机银行转账的应用软件设计42-44
- 5.3 本章小结44-45
- 第6章 总结与展望45-48
- 6.1 总结45-46
- 6.2 展望46-48
- 参考文献48-51
- 攻读学位期间取得的研究成果51-52
- 致谢52
【参考文献】
中国期刊全文数据库 前10条
1 王韵琪;俞一彪;;自适应高斯混合模型及说话人识别应用[J];通信技术;2014年07期
2 吴慧玲;杜成东;毛鹤;;基于GMM的说话人识别算法的研究与应用[J];现代计算机(专业版);2014年14期
3 赵玉晓;顾秀秀;张二华;;与文本无关说话人识别[J];计算机与数字工程;2014年02期
4 陈觉之;张贵荣;周宇欢;;基于GMM模型的自适应说话人识别研究[J];计算机与现代化;2013年07期
5 李杰;刘贺平;;用于说话人识别的基于可变因子整合的高斯混合模型[J];模式识别与人工智能;2012年06期
6 胡政权;曾毓敏;宗原;李梦超;;说话人识别中MFCC参数提取的改进[J];计算机工程与应用;2014年07期
7 陈黎;徐东平;;基于SVM-GMM的开集说话人识别方法[J];计算机工程;2011年14期
8 曹洁;潘鹏;;基于GMM的说话人识别技术研究[J];计算机工程与应用;2011年11期
9 陈业仙;张歆奕;毛杰;;基于GMM-UBM的语言辨识算法研究[J];五邑大学学报(自然科学版);2010年03期
10 檀蕊莲;;基于DTW的说话人识别技术研究[J];黑龙江科技信息;2010年13期
中国硕士学位论文全文数据库 前1条
1 辛全超;基于GMM的说话人语音识别研究与实践[D];华东师范大学;2010年
,本文编号:857447
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/857447.html