当前位置:主页 > 科技论文 > 信息工程论文 >

基于DNN的低资源语音识别特征提取技术

发布时间:2019-11-07 11:23
【摘要】:针对低资源训练数据条件下深层神经网络(Deep neural network,DNN)特征声学建模性能急剧下降的问题,提出两种适合于低资源语音识别的深层神经网络特征提取方法.首先基于隐含层共享训练的网络结构,借助资源较为丰富的语料实现对深层瓶颈神经网络的辅助训练,针对BN层位于共享层的特点,引入Dropout,Maxout,Rectified linear units等技术改善多流训练样本分布不规律导致的过拟合问题,同时缩小网络参数规模、降低训练耗时;其次为了改善深层神经网络特征提取方法,提出一种基于凸非负矩阵分解(Convex-non-negative matrix factorization,CNMF)算法的低维高层特征提取技术,通过对网络的权值矩阵分解得到基矩阵作为特征层的权值矩阵,然后从该层提取一种新的低维特征.基于Vystadial 2013的1小时低资源捷克语训练语料的实验表明,在26.7小时的英语语料辅助训练下,当使用Dropout和Rectified linear units时,识别率相对基线系统提升7.0%;当使用Dropout和Maxout时,识别率相对基线系统提升了12.6%,且网络参数数量相对其他系统降低了62.7%,训练时间降低了25%.而基于矩阵分解的低维特征在单语言训练和辅助训练的两种情况下都取得了优于瓶颈特征(Bottleneck features,BNF)的识别率,且在辅助训练的情况下优于深层神经网络隐马尔科夫识别系统,提升幅度从0.8%~3.4%不等.

【相似文献】

相关期刊论文 前10条

1 郭远琼;提高语音识别率点滴[J];电脑技术;2000年03期

2 邢文;语音识别[J];个人电脑;2000年02期

3 ;语音识别的真相[J];个人电脑;2001年12期

4 ;语音识别渐入佳境[J];个人电脑;2002年03期

5 ;微软语音识别软件可与人直接对话[J];自动化博览;2003年04期

6 ;语音识别[J];印刷世界;2004年01期

7 杰里米·瓦格斯塔夫;让语音识别软件 解放你的双手[J];农业图书情报学刊;2004年03期

8 韩纪庆,王欢良,李海峰,郑铁然;基于语音识别的发音学习技术[J];电声技术;2004年09期

9 陈孝强;语音识别拟起新潮[J];微电脑世界;2005年07期

10 韩纪庆;张磊;郑铁然;;网络环境下的语音识别方法[J];计算机科学;2005年01期

相关会议论文 前10条

1 张歆奕;吴今培;张其善;;语音的共性特征及其在语音识别中的应用[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年

2 杜树木;何良华;;一种新的基于段长分布的语音识别模型[A];2009年通信理论与信号处理学术年会论文集[C];2009年

3 李桢;高万林;欧文浩;徐山川;;基于关键词语音识别的农业信息语音服务系统的研究与实现[A];中国农业工程学会电气信息与自动化专业委员会、中国电机工程学会农村电气化分会科技与教育专委会2010年学术年会论文摘要[C];2010年

4 张冰;龙长才;罗海风;;熟悉掩蔽音背景下的目标语音识别[A];泛在信息社会中的声学——中国声学学会2010年全国会员代表大会暨学术会议论文集[C];2010年

5 王承发;赵德彬;金山;苗百利;朱志莹;;语音识别应用中抗噪声干扰方法的初步探讨[A];第二届全国人机语音通讯学术会议论文集[C];1992年

6 杜笑平;杨启纲;杨家沅;;过零周期转移概率矩阵语音识别部件的研制[A];第二届全国人机语音通讯学术会议论文集[C];1992年

7 季宏;刘志文;杜燕玲;黄曾阳;;语音识别中的音字转换[A];第三届全国人机语音通讯学术会议论文集[C];1994年

8 葛余博;杨大利;曾德超;;噪声环境下语音识别的几个问题(一)[A];第三届全国人机语音通讯学术会议论文集[C];1994年

9 朱奇峰;俞铁城;;听觉中的协同现象和其对语音识别影响的探讨[A];第四届全国人机语音通讯学术会议论文集[C];1996年

10 姚磊;黄泰翼;陈景东;;一种高鲁棒性语音识别的通用自适应方法研究[A];第四届全国人机语音通讯学术会议论文集[C];1996年

相关重要报纸文章 前10条

1 黄梦;方案商积极切入语音识别市场[N];电脑商报;2006年

2 闫婷;语音识别 理想与现实的距离[N];计算机世界;2007年

3 刘喜喜;语音识别将把鼠标键盘打入冷宫?[N];中国计算机报;2008年

4 乐天;语音识别:让你的手机更聪明[N];计算机世界;2011年

5 特约作者 王佳彬;语音识别渐入佳境[N];电脑报;2002年

6 雨夏;语音识别重在应用[N];计算机世界;2001年

7 ;语音识别企业应用前景光明[N];计算机世界;2003年

8 王向东 栾焕博 林守勋 钱跃良;语音识别:抗噪音能力有待加强[N];计算机世界;2006年

9 上海 高博;让电脑“听懂”人话[N];电脑报;2008年

10 张彤;语音识别融入统一通信[N];网络世界;2008年

相关博士学位论文 前10条

1 许金普;农产品市场信息采集的语音识别鲁棒性方法研究[D];中国农业科学院;2015年

2 包希日莫;面向蒙古语的语音识别声学建模研究[D];内蒙古大学;2016年

3 吴斌;语音识别中的后处理技术研究[D];北京邮电大学;2008年

4 奉小慧;音频噪声环境下唇动信息在语音识别中的应用技术研究[D];华南理工大学;2010年

5 孙f,

本文编号:2557258


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/2557258.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户53bb8***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com