当前位置:主页 > 科技论文 > 网络通信论文 >

基于MFCC和PSO-BP神经网络的说话人识别系统

发布时间:2017-06-12 13:10

  本文关键词:基于MFCC和PSO-BP神经网络的说话人识别系统,由笔耕文化传播整理发布。


【摘要】:说话人识别是一项随着数字化信息发展起来的生物识别技术,基于人工神经网络的说话人识别技术也成为生物识别技术领域中重要的研究热点之一。基于人工神经网络的说话人识别技术,相较于传统的基于线性系统理论的技术,具有非线性分布式并行处理、较强的模式分类能力、优良的不完全信息的鲁棒性等特点。人工神经网络是一种模仿动物神经网络行为特征的网络模型,在信息模糊化等说话人识别技术相关问题上具有自主学习的优势。本文首先对说话人识别技术和人工神经网络及其优化算法的发展、研究现状作了介绍,并从语音信号的预处理开始分析,对语音信号进行了预加重、端点检测,滤除了说话人语音中的静音段和噪声段,为后续的特征参数提取提供了有效的语音段。文中还将基于谱减法增强的梅尔倒谱特征参数(Mel-Frequency Cepstrum Coefficient,MFCC)与传统的梅尔倒谱参数特征参数进行了比较,前者在噪声条件下具有更好的鲁棒性。对于传统说话人识别模型需要大量训练数据,鲁棒性差以及存储空间大等缺陷,本文提出了反向传播(Back-Propagation,BP)算法网络模型。BP网络模型能够随经验不断改善性能,通过自组织自学习自适应调整网络模型参数。本文重点研究了BP神经网络模型的特点,针对BP神经网络收敛速度慢、易陷入局部极小等问题,引进了粒子群算法(Particle Swarm Optimization,PSO),建立了PSO-BP神经网络模型。通过粒子群优化算法(PSO)来训练BP神经网络的权值和阈值,可以有效寻求最佳解空间、加快全局搜索。在实验验证环节,相对于传统说话人识别模型,基于PSO-BP神经网络的说话人识别系统的识别率和训练速度都得到了较大的提高。
【关键词】:说话人识别 MFCC特征参数 BP神经网络 粒子群算法 谱减法语音增强
【学位授予单位】:南京邮电大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.34;TP183
【目录】:
  • 摘要4-5
  • Abstract5-8
  • 第一章 绪论8-14
  • 1.1 引言8
  • 1.2 说话人识别的研究目的与意义8-10
  • 1.3 国内外研究综述10-11
  • 1.3.1 说话人识别研究的现状10
  • 1.3.2 人工神经网络研究的现状10-11
  • 1.3.3 PSO算法研究的现状11
  • 1.4 本文研究内容11-13
  • 1.4.1 反向传播(BP)神经网络12
  • 1.4.2 粒子群算法(PSO)12
  • 1.4.3 基于PSO-BP的网络模型12-13
  • 1.5 本文组织结构13-14
  • 第二章 说话人识别预处理和特征提取14-24
  • 2.1 说话人识别预处理14-16
  • 2.2 说话人识别特征提取16-21
  • 2.3 基于谱减法增强的MFCC特征参数提取21-23
  • 2.3.1 基于谱减法的语音增强21-22
  • 2.3.2 改进后的MFCC特征参数提取22-23
  • 2.4 本章小结23-24
  • 第三章 PSO-BP网络结构24-38
  • 3.1 人工神经网络原理24-26
  • 3.1.1 人工神经网络概念24
  • 3.1.2 人工神经网络结构24-26
  • 3.1.3 人工神经网络的分类26
  • 3.2 反向传播算法(BP算法)26-29
  • 3.2.1 BP算法网络模型26-28
  • 3.2.2 BP学习算法28-29
  • 3.3 BP算法存在的问题及对策29-33
  • 3.3.1 BP算法存在的问题29-30
  • 3.3.2 对策30-33
  • 3.4 粒子群算法起源33-34
  • 3.5 粒子群算法原理34-35
  • 3.6 粒子群算法结构35-37
  • 3.6.1 粒子群算法(PSO)的步骤和流程35-36
  • 3.6.2 设计过程中应注意的参数设置36-37
  • 3.7 本章小结37-38
  • 第四章 经典说话人识别方法38-49
  • 4.1 说话人识别原理38
  • 4.2 高斯混合模型(GMM)38-41
  • 4.3 隐马尔可夫模型(HMM)41-43
  • 4.4 矢量量化模型(VQ)43-47
  • 4.5 本章小结47-49
  • 第五章 仿真实验与结果分析49-63
  • 5.1 系统结构49-50
  • 5.2 具体实现过程50-56
  • 5.2.1 预处理过程50-53
  • 5.2.2 特征参数提取53-55
  • 5.2.3 训练识别网络的设计55-56
  • 5.3 实验结果分析56-62
  • 5.3.1 噪声环境下的系统分析56-58
  • 5.3.2 BP/PSO-BP网络性能比较58-60
  • 5.3.3 与经典说话人识别模型的性能比较60-62
  • 5.4 本章小结62-63
  • 第六章 总结与展望63-64
  • 参考文献64-68
  • 附录1 攻读硕士学位期间撰写的论文68-69
  • 附录2 攻读硕士学位期间申请的专利69-70
  • 附录3 攻读硕士学位期间参加的科研项目70-71
  • 致谢71

【相似文献】

中国期刊全文数据库 前10条

1 覃爱娜,韩华;说话人识别技术及其在工厂自动控制系统中的应用[J];长沙电力学院学报(自然科学版);2003年02期

2 杨海燕,杨斌,景新幸;说话人识别技术在智能家居中的应用[J];电声技术;2004年05期

3 王晶晶,陈中柱,薛文涛,江红英;一种与文本有关的说话人识别系统设计与实现[J];计算机仿真;2004年06期

4 戴红霞,赵力;采用帧概率变换的与文本无关说话人识别系统的实现[J];电声技术;2004年09期

5 叶蕾,方鹏,杨震;基于因特网的说话人识别技术研究[J];南京邮电学院学报;2004年03期

6 孙林慧,叶蕾,杨震;说话人识别中测试时长与识别率关系研究[J];计算机仿真;2005年05期

7 陆小珊,王俊法,田岚;音高特征在说话人识别中的可分性及应用研究[J];山东大学学报(工学版);2005年04期

8 芮贤义,俞一彪;基于小波变换的鲁棒型特征提取及说话人识别[J];电路与系统学报;2005年05期

9 刘雅琴,杜海明;基于矢量量化的说话人识别[J];洛阳师范学院学报;2005年05期

10 陈立伟;赵春晖;姜海丽;;一种基于混合神经网络的说话人识别系统[J];哈尔滨工程大学学报;2005年06期

中国重要会议论文全文数据库 前10条

1 鲍福良;方志刚;徐洁;;说话人识别综述[A];第六届全国信息获取与处理学术会议论文集(2)[C];2008年

2 孙帆;迟惠生;;循环网络说话人识别[A];第二届全国人机语音通讯学术会议论文集[C];1992年

3 肖剑;欧贵文;;多层前馈神经网络组的文本无关说话人识别[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年

4 张玲华;郑宝玉;杨震;;模糊超椭球聚类算法及其在说话人识别中的应用研究[A];第八届全国人机语音通讯学术会议论文集[C];2005年

5 王宏;潘金贵;;基于矩阵正态分布的文本有关说话人识别[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年

6 戴红霞;赵力;;文本无关说话人识别系统的研究[A];2007’促进西部发展声学学术交流会论文集[C];2007年

7 陈联武;郭武;戴礼荣;;说话人识别系统中多样训练的应用[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年

8 崔玉红;胡光锐;;基于神经网络特征维数压缩方法及其在说话人识别中的应用[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年

9 吴丽丽;;基于仿生模式识别的说话人识别学习模型研究[A];第二届中国科学院博士后学术年会暨高新技术前沿与发展学术会议程序册[C];2010年

10 张晶;董金明;冯文全;;说话人识别系统研究与实现[A];全国第二届信号处理与应用学术会议专刊[C];2008年

中国重要报纸全文数据库 前3条

1 汪永安;科大讯飞说话人识别技术世界领先[N];安徽日报;2008年

2 吴长锋;科大讯飞勇夺说话人识别国际大赛第一[N];科技日报;2008年

3 新城;小声音 大前景[N];计算机世界;2006年

中国博士学位论文全文数据库 前10条

1 单振宇;情感说话人识别及其解决方法的研究[D];浙江大学;2010年

2 陆伟;基于缺失特征的文本无关说话人识别鲁棒性研究[D];中国科学技术大学;2008年

3 刘镝;说话人识别中信息融合算法的研究[D];北京交通大学;2011年

4 俞一彪;基于互信息理论的说话人识别研究[D];上海大学;2004年

5 付中华;说话人识别系统鲁棒性研究[D];西北工业大学;2004年

6 侯丽敏;基于非线性理论和信息融合的说话人识别[D];上海大学;2005年

7 林琳;基于模糊聚类与遗传算法的说话人识别理论研究及应用[D];吉林大学;2007年

8 邱政权;在噪声环境下的说话人识别[D];华南理工大学;2007年

9 郭武;复杂信道下的说话人识别[D];中国科学技术大学;2007年

10 钱博;基于汉语元音映射的说话人识别技术研究[D];南京理工大学;2007年


  本文关键词:基于MFCC和PSO-BP神经网络的说话人识别系统,,由笔耕文化传播整理发布。



本文编号:444130

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/444130.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4eeb3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com