当前位置:主页 > 科技论文 > 信息工程论文 >

基于改进的深度神经网络的说话人辨认研究

发布时间:2018-02-20 23:40

  本文关键词: 说话人辨认 堆叠降噪自编码 深度信念网络 整流线性单元 出处:《电子器件》2017年05期  论文类型:期刊论文


【摘要】:说话人辨认技术在许多领域有着广泛的应用前景。首先研究了两种基本的深度神经网络模型(深度信念网络和降噪自编码)在说话人辨认上的应用,深度神经网络通过逐层无监督的预训练和有监督的反向微调避免了反向传播容易陷入局部最小值的缺陷,通过实验证明了当神经元个数达到一定数量之后深度网络模型是优于普通BP网络的,并且其性能随着网络规模的扩大而提升。考虑到大规模的深度网络训练时间较长的缺点,提出使用整流线性单元(Re LU)代替传统的sigmoid类函数对说话人识别的深度模型进行改进,实验结果表明改进后的深度模型平均训练时间减少了35%,平均误识率降低了8.3%。
[Abstract]:Speaker identification technology has a wide application prospect in many fields. Firstly, two basic depth neural network models (depth belief network and noise reduction self-coding) are studied. The depth neural network avoids the defect that backpropagation is prone to fall into local minimum by layer by layer unsupervised pre-training and supervised reverse fine-tuning. The experiments show that the depth network model is superior to the common BP network when the number of neurons reaches a certain number, and its performance is improved with the expansion of the network size. This paper proposes an improved depth model for speaker recognition using rectifier linear unit re LU instead of the traditional sigmoid class function. The experimental results show that the average training time of the improved depth model is reduced by 35% and the average error rate is reduced by 8.3%.
【作者单位】: 南京工程学院电力工程学院;东南大学信息科学与工程学院;
【基金】:国家自然科学基金项目(61301219) 南京工程学院校级项目(YKJ201107) 2014年青蓝工程项目
【分类号】:TN912.3;TP183

【相似文献】

相关期刊论文 前10条

1 刘文举,孙兵,钟秋海;基于说话人分类技术的分级说话人识别研究[J];电子学报;2005年07期

2 丁辉;唐振民;钱博;李燕萍;;易扩展小样本环境说话人辨认系统的研究[J];系统仿真学报;2008年10期

3 刘明辉;黄中伟;熊继平;;用于说话人辨识的评分规整[J];计算机工程与应用;2010年12期

4 陈雪芳;杨继臣;;一种三层判决的说话人索引算法[J];计算机工程;2012年02期

5 杨继臣;何俊;李艳雄;;一种基于性别的说话人索引算法[J];计算机工程与科学;2012年06期

6 何致远,胡起秀,徐光yP;两级决策的开集说话人辨认方法[J];清华大学学报(自然科学版);2003年04期

7 殷启新,韩春光,杨鉴;基于掌上电脑录音的说话人辨认[J];云南民族学院学报(自然科学版);2003年04期

8 吕声,尹俊勋;同语种说话人转换的实现[J];移动通信;2004年S3期

9 董明,刘加,刘润生;快速口音自适应的动态说话人选择性训练[J];清华大学学报(自然科学版);2005年07期

10 曹敏;王浩川;;说话人自动识别技术研究[J];中州大学学报;2007年02期

相关会议论文 前10条

1 司罗;胡起秀;金琴;;完全无监督的双人对话中的说话人分隔[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年

2 金乃高;侯刚;王学辉;李非墨;;基于主动感知的音视频联合说话人跟踪方法[A];2010年通信理论与信号处理学术年会论文集[C];2010年

3 马勇;鲍长春;夏丙寅;;基于辨别性深度信念网络的说话人分割[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年

4 白俊梅;张树武;徐波;;广播电视中的目标说话人跟踪技术[A];第八届全国人机语音通讯学术会议论文集[C];2005年

5 索宏彬;刘晓星;;基于高斯混合模型的说话人跟踪系统[A];第八届全国人机语音通讯学术会议论文集[C];2005年

6 罗海风;龙长才;;多话者环境下说话人辨识听觉线索研究[A];中国声学学会2009年青年学术会议[CYCA’09]论文集[C];2009年

7 王刚;邬晓钧;郑方;王琳琳;张陈昊;;基于参考说话人模型和双层结构的说话人辨认快速算法[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年

8 王刚;邬晓钧;郑方;王琳琳;张陈昊;;基于参考说话人模型和双层结构的说话人辨认[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年

9 何磊;方棣棠;吴文虎;;说话人聚类与模型自适应结合的说话人自适应方法[A];第六届全国人机语音通讯学术会议论文集[C];2001年

10 张彬桥;;基于主分量分析的说话人特征提取[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年

相关博士学位论文 前10条

1 李威;多人会话语音中的说话人角色分析[D];华南理工大学;2015年

2 杨继臣;说话人信息分析及其在多媒体检索中的应用研究[D];华南理工大学;2010年

3 郑建炜;基于核方法的说话人辨认模型研究[D];浙江工业大学;2010年

4 吕声;说话人转换方法的研究[D];华南理工大学;2004年

5 陈凌辉;说话人转换建模方法研究[D];中国科学技术大学;2013年

6 玄成君;基于语音频率特性抑制音素影响的说话人特征提取[D];天津大学;2014年

7 李燕萍;说话人辨认中的特征参数提取和鲁棒性技术研究[D];南京理工大学;2009年

8 徐利敏;说话人辨认中的特征变换和鲁棒性技术研究[D];南京理工大学;2008年

9 王坚;语音识别中的说话人自适应研究[D];北京邮电大学;2007年

10 侯代文;非线性滤波及其在说话人跟踪中的应用研究[D];大连理工大学;2008年

相关硕士学位论文 前10条

1 杨浩;基于广义音素的文本无关说话人认证的研究[D];北京邮电大学;2008年

2 蒋博;特定目标说话人的语音转换系统设计[D];电子科技大学;2015年

3 陈雨莺;基于EMD的说话人特征参数提取方法研究[D];湘潭大学;2015年

4 单燕燕;变音环境下鲁棒性说话人辨认关键技术研究[D];南京邮电大学;2015年

5 肖泽苹;无线电对讲语音的说话人分割聚类研究[D];北京理工大学;2016年

6 李锐;基于因子分析的说话人分离技术研究[D];中国科学技术大学;2016年

7 张亚明;说话人性别识别和年龄估计的系统研制[D];华南理工大学;2016年

8 倪冬琴;基于特征子空间量化的文本无关说话人年龄识别[D];苏州大学;2016年

9 李湾湾;说话人声纹识别的算法研究[D];浙江大学;2017年

10 唐郅;语音驱动虚拟说话人研究[D];西南交通大学;2017年



本文编号:1520364

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1520364.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户55a69***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com