声纹识别相关技术研究及应用

发布时间：2017-10-11 01:28

本文关键词：声纹识别相关技术研究及应用

【摘要】：声纹识别技术作为仅次于掌纹和指纹识别的第三大生物特征识别技术,在金融、司法、安全和智能设备中有着广泛的应用。相对于指纹和掌纹这些生物特征识别技术,声纹识别技术具有采集方便、成本低以及算法复杂度低等优势。因此,声纹识别技术发展空间广阔,商业价值和意义重大,是国内外学者研究的一个热点。梅尔倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)是声纹识别中最常用的一种体现语音特征的参数,它是一种模仿人耳的听觉特性而提取的一种特征参数,它与线性倒谱不同,能够很好地反应语音信号的特征。本文在研究了MFCC参数的提取过程和小波包分解的相关理论的基础上,针对MFCC参数提取过程中忽略了部分高频细节和MFCC参数只能反映语音静态特征这两个问题,利用小波包分解对MFCC参数的提取过程进行改进。实验证明,改进的特征参数在声纹识别中具有较高的识别率和较好的抗噪性。支持向量机(Support Vector Machine,SVM)是一种机器学习的方法,它追求在有限的样本数量条件下得到最优的分类结果。本文在研究了SVM的核函数及其参数对SVM分类的影响的基础上,针对惩罚因子和核参数的选取,利用粒子群算法(Particle Swarm Optimization,PSO)对两个参数进行寻优,并对PSO算法进行改进,改善了算法的性能并应用到SVM中。实验证明改进的PSO算法对SVM参数进行优化,在声纹识别应用中能够达到较好的分类效果,提高了识别率。在研究了声纹识别技术中的语音信号处理、特征参数提取以及模板匹配算法的基础上,将声纹识别技术应用到说话人确认系统中,设计了一套基于说话人确认的智能门禁系统,并通过实验验证了系统的可行性。
【关键词】：声纹识别 梅尔倒谱系数 小波包分解 支持向量机 粒子群算法
【学位授予单位】：南京航空航天大学
【学位级别】：硕士
【学位授予年份】：2016
【分类号】：TN912.34;TP18
【目录】：

摘要4-5
Abstract5-11
注释表11-12
第一章绪论12-17
1.1 课题研究背景及意义12-13
1.1.1 声纹识别的研究背景12
1.1.2 声纹识别的研究意义和应用12-13
1.2 声纹识别的国内外研究现状和技术难点13-15
1.3 本文研究的内容15-17
1.3.1 论文的主要工作15-16
1.3.2 论文的组织结构16-17
第二章声纹识别技术中的语音信号处理17-33
2.1 声纹识别概述17-19
2.1.1 声纹识别简介17
2.1.2 声纹识别分类17-18
2.1.3 声纹识别系统介绍18-19
2.2 语音信号的预处理19-23
2.2.1 预加重19-20
2.2.2 分帧加窗20-23
2.3 语音信号的端点检测23-25
2.3.1 双阈值端点检测方法23-24
2.3.2 声音信号端点检测实验24-25
2.4 语音信号的特征提取25-32
2.4.1 时域特征25-28
2.4.2 频域特征28-29
2.4.3 梅尔倒谱特征29-32
2.5 本章小结32-33
第三章小波变换与梅尔倒谱结合的声音特征提取方法33-43
3.1 差分MFCC特征提取33-34
3.2 基于小波包节点能量的声纹特征提取34-37
3.2.1 小波包分解理论35-36
3.2.2 小波包节点能量提取36-37
3.3 基于小波包分解的MFCC特征提取方法的改进37-39
3.4 声纹识别实验39-42
3.4.1 实验语音库39-40
3.4.2 实验方法和结果40-41
3.4.3 实验结果分析41-42
3.5 本章小结42-43
第四章基于改进SVM的声纹识别方法研究43-56
4.1 声纹识别的匹配模型43-44
4.1.1 模板匹配法43
4.1.2 概率统计模型算法43-44
4.1.3 机器学习算法44
4.2 基于SVM的声纹识别系统44-48
4.2.1 SVM概述44-45
4.2.2 SVM在声纹识别系统中的应用45-46
4.2.3 SVM的参数选择46-47
4.2.4 实验结果及结论47-48
4.3 SVM参数优化算法48-55
4.3.1 PSO算法49-51
4.3.2 基于PSO算法的SVM模型参数寻优51
4.3.3 PSO算法的改进51-52
4.3.4 基于和声搜索算法的PSO算法改进52-53
4.3.5 改进的PSO算法优化SVM参数的声纹识别系统实验分析53-55
4.4 本章小结55-56
第五章基于说话人确认的模拟门禁系统设计56-67
5.1 说话人确认的结构56-57
5.2 主要实现步骤57
5.3 说话人确认系统搭建及实验57-60
5.3.1 系统界面57-58
5.3.2 在线说话人确认身份实验58-59
5.3.3 离线说话人确认实验59-60
5.4 基于说话人确认的模拟门禁系统设计60-64
5.4.1 硬件架构61
5.4.2 软件部分61-64
5.5 基于说话人确认的模拟门禁系统实验64-66
5.5.1 实验设计64-65
5.5.2 识别率的计算65
5.5.3 在线门禁系统模拟实验65-66
5.6 本章小结66-67
第六章总结与展望67-69
6.1 全文总结67
6.2 展望67-69
参考文献69-72
致谢72-73
在学期间的研究成果及发表的学术论文73

【参考文献】

中国期刊全文数据库前10条

1 汪庆华;刘江炜;张兰兰;;交叉验证K近邻算法分类研究[J];西安工业大学学报;2015年02期

2 何清;李宁;罗文娟;史忠植;;大数据下的机器学习算法综述[J];模式识别与人工智能;2014年04期

3 刘琦;尹国祥;;基于Matlab的语音信号预处理技术研究[J];电子技术与软件工程;2014年01期

4 李豫芹;朱凯进;;声纹识别技术在调度录音分析的应用研究[J];电子世界;2013年22期

5 陈拥权;张羽;胡篮，

本文编号：1009754

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1009754.html

上一篇：基于NAO机器人的医疗助手系统的设计与实现
下一篇：基于神经网络的污水处理多变量控制方法研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|