当前位置:主页 > 科技论文 > 信息工程论文 >

基于含噪语音的说话人识别研究

发布时间:2020-03-30 22:02
【摘要】:随着计算机技术及移动互联网技术的快速发展,说话人识别作为一种特殊生物识别技术主要用于特定场合的说话人身份鉴定。该技术在司法鉴定、身份确认、军事国防、远程控制、信息安全等领域得到广泛应用,是模式识别和人工智能领域中的研究热点。在训练与测试环境均为干净语音环境下,说话人识别系统识别率较高,然而,受制于环境噪音,在实际应用中说话人识别系统的训练与测试环境不匹配,系统识别性能降低。因此,如何有效提高噪声环境下说话人识别系统性能成为了关键的研究点。本文主要对语音增强、特征提取等相关方面的内容进行研究,提出了一种非负矩阵分解优化算法,研究了深度学习用于特征提取的识别效果,以解决因噪声因素带来的不利影响,提高系统识别率。最后设计相关的图形用户界面完成语音信号录制和识别结果显示。本文主要研究内容如下:1.提出了一种非负矩阵分解优化算法。分析了谱减法和传统非负矩阵分解算法的优缺点,提出非负矩阵分解优化算法对含噪语音信号进行处理,得到具有较好语音质量的重构语音。结合各算法优势,将谱减法、非负矩阵分解算法以及非负矩阵优化算法的幅度进行加权融合,进一步增强算法泛化能力。实验证明,与传统语音增强算法进行对比,相同条件下非负矩阵分解优化算法的增强效果更优。与单一语音增强算法相比,融合算法在大多数噪音环境下具有较好的增强效果。2.提出了深浅层特征融合的特征提取方法。本文采用深度自动编码网络对含噪语音信号进行特征提取,基于深度置信网络的自动编码器能有效过滤语音中的噪声成分,挖掘浅层特征中隐藏个性信息的深层表示,将深层特征与浅层特征输入i-vector模型后进行分数级融合。实验表明与噪声环境下单一特征参数相比,融合特征能更全面地描述说话人信息,提高系统识别率。3.设计了基于MATLAB的图形用户界面。利用MATLAB自带工具箱和内置函数设计说话人识别平台界面。通过录制语音信号以及识别说话人对系统平台进行测试,结果表明平台具有较好的可交互性。
【图文】:

说话人识别,语音识别,声纹,说话人


第 2 章 说话人识别的关键技术.1 说话人识别概述说话人识别是一种通过对语音信号中包含的声纹特征进行分析获取说话人信息进行身份验证的特殊生物技术,又称为“声纹识别”。语音识别与说话别的区别在于语音识别中所使用的特征参数主要表征的是语音中的语义信息说话人识别中的特征参数主要表征的是说话人的个性信息[63],两者的侧重点,,所建立的模型也不相同。对语音信号处理技术进行分类,图 2.1 可以表示说识别技术与语音识别、语义识别等语音信号处理技术的关系。

说话人识别


图 2.2 说话人识别分类说话人识别和文本无关的说话人识别是说话人识行划分的。前者规定语音文本内容,要求说话人说的内容相同。一般情况下这类说话人识别系统的有一定限制。后者预先不确定文本内容,即训练与文本相关的说话人识别技术相比,该技术识别应用相对比较广泛。识别的基本组成系统分为训练和测试两个阶段。训练阶段是对输特征提取,然后为每个说话人建立一个描述说话并且模型的训练阶段也被称为模型预留。测试阶
【学位授予单位】:重庆邮电大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TN912.34

【相似文献】

相关期刊论文 前10条

1 刘倩;李时;;细菌趋药性算法在说话人识别中的应用[J];宿州学院学报;2017年11期

2 赵艳;吕亮;赵力;;基于修正Fukunaga-Koontz变换的说话人识别方法[J];电子器件;2018年04期

3 李为州;杨印根;;说话人识别中基于深度信念网络的超向量降维的研究[J];电脑知识与技术;2017年22期

4 雷震春;万艳红;罗剑;朱明华;;基于Mahalanobis距离的说话人识别模型研究[J];中国语音学报;2016年00期

5 王华朋;李宁;许锋;蔡能斌;;基于元音共振峰特征的法庭说话人识别[J];中国刑警学院学报;2014年02期

6 王华朋;杨军;许勇;;应用似然比框架的法庭说话人识别[J];数据采集与处理;2013年02期

7 檀蕊莲;刘建平;;说话人识别技术的研究进展[J];科技资讯;2007年33期

8 宁飞,陈频;说话人识别的几种方法[J];电声技术;2001年12期

9 曹业敏,侯风雷,王炳锡;说话人识别技术现状与进展[J];河南科技;1998年09期

10 王华朋;杨军;吴鸣;许勇;;基于自适应同源方差控制的法庭自动说话人识别[J];应用科学学报;2014年06期

相关会议论文 前10条

1 黄猛;唐琳;王雅芬;;说话人识别技术综述[A];第十三届全国信号和智能信息处理与应用学术会议论文集[C];2019年

2 孙帆;迟惠生;;循环网络说话人识别[A];第二届全国人机语音通讯学术会议(NCMMSC1992)论文集[C];1992年

3 肖剑;欧贵文;;多层前馈神经网络组的文本无关说话人识别[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年

4 吴玺宏;刘文举;;听神经计算模型及其在抗噪说话人识别中的应用[A];第六届全国人机语音通讯学术会议论文集[C];2001年

5 任舒彬;杨莹春;吴朝晖;;面向多通道说话人识别的预处理方法实验研究(类别:声纹鉴定)[A];第六届全国现代语音学学术会议论文集(下)[C];2003年

6 刘大力;赵力;;与文本无关说话人识别系统的性能比较[A];2004年全国物理声学会议论文集[C];2004年

7 张陈昊;郑方;王琳琳;;基于多音素类模型的文本无关短语音说话人识别[A];需将论文集名称修改为“第十二届全国人机语音通讯学术会议(NCMMSC2013)论文集[C];2013年

8 周昊朗;王岚;陈珂;;一个面向说话人识别的汉语语音数据库[A];第六届全国人机语音通讯学术会议论文集[C];2001年

9 龙川;景新幸;杨海燕;;矢量量化与协方差矩阵结合的说话人识别方法[A];泛在信息社会中的声学——中国声学学会2010年全国会员代表大会暨学术会议论文集[C];2010年

10 周昊朗;王岚;吴玺宏;迟惠生;;一个面向说话人识别的汉语语音数据库[A];信号与信息处理技术——第一届信号与信息处理联合学术会议论文集[C];2002年

相关重要报纸文章 前2条

1 汪永安;科大讯飞说话人识别技术世界领先[N];安徽日报;2008年

2 吴长锋;科大讯飞勇夺说话人识别国际大赛第一[N];科技日报;2008年

相关博士学位论文 前10条

1 徐珑婷;基于稀疏分解的说话人识别技术研究[D];南京邮电大学;2017年

2 陆伟;基于缺失特征的文本无关说话人识别鲁棒性研究[D];中国科学技术大学;2008年

3 俞一彪;基于互信息理论的说话人识别研究[D];上海大学;2004年

4 付中华;说话人识别系统鲁棒性研究[D];西北工业大学;2004年

5 侯丽敏;基于非线性理论和信息融合的说话人识别[D];上海大学;2005年

6 雷震春;支持向量机在说话人识别中的应用研究[D];浙江大学;2006年

7 姚志强;说话人识别中提高GMM性能方法的研究[D];中国科学技术大学;2006年

8 包永强;噪声环境下说话人识别的研究[D];东南大学;2006年

9 林琳;基于模糊聚类与遗传算法的说话人识别理论研究及应用[D];吉林大学;2007年

10 解焱陆;基于特征变换和分类的文本无关电话语音说话人识别研究[D];中国科学技术大学;2007年

相关硕士学位论文 前10条

1 姜孝伟;说话人识别系统的设计与研究[D];上海交通大学;2018年

2 陈松;基于VQ的室内说话人识别及FPGA实现研究[D];安徽理工大学;2019年

3 蔡国都;基于x-vector的说话人识别研究[D];北京交通大学;2019年

4 孙念;基于多特征I-Vector的短语音说话人识别方法研究[D];重庆邮电大学;2019年

5 巴莉芳;基于含噪语音的说话人识别研究[D];重庆邮电大学;2019年

6 刘崇鸣;基于三元组损失与流形降维的文本无关说话人识别方法研究[D];哈尔滨工业大学;2019年

7 林婷;基于ICA和ASR语音特征选取的说话人识别算法[D];南昌大学;2019年

8 陈园允;变形欺骗性语音的检测算法研究及对其鲁棒的说话人识别系统实现[D];广东技术师范大学;2019年

9 徐钰婷;跨语言背景下基于单元音的说话人识别研究[D];深圳大学;2018年

10 陈莉芬;基于英语爆破音和摩擦音的跨语言说话人识别研究[D];深圳大学;2018年



本文编号:2608122

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/2608122.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户69851***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com