当前位置:主页 > 科技论文 > 网络通信论文 >

基于声学特征空间非线性流形结构的语音识别声学模型

发布时间:2017-09-23 17:35

  本文关键词:基于声学特征空间非线性流形结构的语音识别声学模型


  更多相关文章: 语音识别 声学模型 非线性流形 混合因子分析


【摘要】:从语音信号声学特征空间的非线性流形结构特点出发,利用流形上的压缩感知原理,构建新的语音识别声学模型.将特征空间划分为多个局部区域,对每个局部区域用一个低维的因子分析模型进行近似,从而得到混合因子分析模型.将上下文相关状态的观测矢量限定在该非线性低维流形结构上,推导得到其观测概率模型.最终,每个状态由一个服从稀疏约束的权重矢量和若干个服从标准正态分布的低维局部因子矢量所决定.文中给出了局部区域潜在维数的确定准则及模型参数的迭代估计算法.基于RM语料库的连续语音识别实验表明,相比于传统的高斯混合模型(Gaussian mixture model,GMM)和子空间高斯混合模型(Subspace Gaussian mixture model,SGMM),新声学模型在测试集上的平均词错误率(Word error rate,WER)分别相对下降了33.1%和9.2%.
【作者单位】: 解放军信息工程大学信息系统工程学院;
【关键词】语音识别 声学模型 非线性流形 混合因子分析
【基金】:国家自然科学基金(61403415,61175017)资助~~
【分类号】:TN912.34
【正文快照】: 在连续语音识别中,为了反映同一音素在不同上下文环境中发音的不同,通常采用上下文相关音素建模方法,即对每一个音素的不同音位变体,分别用一个隐马尔科夫模型(Hidden Markov model,HMM)进行建模,其中每一个隐含状态的观测概率分布用高斯混合模型(Gaussian mixture model,GMM)

【相似文献】

中国期刊全文数据库 前10条

1 ;语音识别[J];中国会计电算化;2000年02期

2 雅文;语音识别新天地[J];中国计算机用户;2000年05期

3 姚文冰,姚天任,韩涛;稳健语音识别技术发展现状及展望[J];信号处理;2001年06期

4 双中;语音识别芯片及应用[J];贵州科学;2002年04期

5 何湘智;语音识别的研究与发展[J];计算机与现代化;2002年03期

6 唐昌文;一种孤立字语音识别的新方法[J];通信技术;2002年08期

7 王玉伟,张磊,韩纪庆;一种基于非线性特征的应力影响下变异语音识别方法[J];信号处理;2002年05期

8 余鹏,王作英;语音识别中空间相关性信息的利用[J];电子学报;2002年07期

9 韩纪庆;一种语音识别中的环境自适应方法[J];计算机工程与应用;2002年01期

10 王作英,赵蕤;高斯样本模式混淆度分析及其在语音识别中的应用[J];计算机工程与应用;2002年18期

中国重要会议论文全文数据库 前10条

1 李桢;高万林;欧文浩;徐山川;;基于关键词语音识别的农业信息语音服务系统的研究与实现[A];中国农业工程学会电气信息与自动化专业委员会、中国电机工程学会农村电气化分会科技与教育专委会2010年学术年会论文摘要[C];2010年

2 王承发;赵德彬;金山;苗百利;朱志莹;;语音识别应用中抗噪声干扰方法的初步探讨[A];第二届全国人机语音通讯学术会议论文集[C];1992年

3 季宏;刘志文;杜燕玲;黄曾阳;;语音识别中的音字转换[A];第三届全国人机语音通讯学术会议论文集[C];1994年

4 朱奇峰;俞铁城;;听觉中的协同现象和其对语音识别影响的探讨[A];第四届全国人机语音通讯学术会议论文集[C];1996年

5 姚磊;黄泰翼;陈景东;;一种高鲁棒性语音识别的通用自适应方法研究[A];第四届全国人机语音通讯学术会议论文集[C];1996年

6 潘胜昔;刘加;江金涛;王作英;陆大金;;基于多模式及集成判决的稳健电话语音识别算法研究[A];第五届全国人机语音通讯学术会议论文集[C];1998年

7 杜利民;;语音识别中的鲁棒性问题[A];第六届全国人机语音通讯学术会议论文集[C];2001年

8 葛余博;谢新艳;葛菱南;杨楠;胡波;;计算机语音识别的新参数[A];第六届全国人机语音通讯学术会议论文集[C];2001年

9 张化云;韩兆兵;徐波;;电话语音翻译中的语音识别研究[A];第六届全国人机语音通讯学术会议论文集[C];2001年

10 张晴晴;潘接林;;模糊发音字典在方言口音语音识别中的应用[A];第八届全国人机语音通讯学术会议论文集[C];2005年

中国重要报纸全文数据库 前10条

1 闫婷;语音识别 理想与现实的距离[N];计算机世界;2007年

2 乐天;语音识别:让你的手机更聪明[N];计算机世界;2011年

3 雨夏;语音识别重在应用[N];计算机世界;2001年

4 王向东 栾焕博 林守勋 钱跃良;语音识别:抗噪音能力有待加强[N];计算机世界;2006年

5 本报记者 操秀英;颜永红:“搜索”语音识别的未来[N];科技日报;2010年

6 本报记者 李映;语音识别飞入寻常百姓家?[N];中国电子报;2012年

7 清华大学 刘加;语音识别应用促进技术发展[N];计算机世界;2006年

8 刘权;OSR提升语音识别率[N];中国计算机报;2004年

9 ;Intel涉足语音识别[N];计算机世界;2003年

10 本报记者 马文方;用互联网思维做语音识别[N];中国计算机报;2013年

中国博士学位论文全文数据库 前10条

1 吴斌;语音识别中的后处理技术研究[D];北京邮电大学;2008年

2 奉小慧;音频噪声环境下唇动信息在语音识别中的应用技术研究[D];华南理工大学;2010年

3 孙f,

本文编号:906643


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/906643.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户8145c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com