农产品市场信息采集的语音识别鲁棒性方法研究
当前语音识别的研究已取得了较为丰硕的成果,在安静环境下性能令人满意,逐渐被应用在诸多人机交互的场合。然而,由于噪声的存在,语音识别系统在实际环境下性能急剧下降,如何提高语音识别的噪声鲁棒性,逐渐成为近年来语音识别的研究热点。本文主要研究农产品市场信息采集作业环境中的语音识别噪声鲁棒性问题,针对当前缺乏面向农产品市场信息采集领域的语音识别引擎,而通用领域的识别算法又不适合解决上述问题,分析环境的噪声特点,面向非特定人和中小规模词汇量的连续汉语普通话识别,训练声学模型,研究适用于该环境下的语音识别鲁棒性方法。本文主要研究的内容包括:(1)基于隐马尔科夫模型(HMM)框架建立了声学模型,利用自建的农产品市场信息语料库进行训练和测试HHM模型,基于HTK工具包建立了农产品价格语音识别基线系统。(2)在分析农产品市场信息采集环境的噪声特点的基础上,从模型空间和特征空间对系统采取了多种鲁棒性方法,包括:在声学模型的识别基元选取上,采用了一种扩展的三音素声韵母模型,有效的解决了音节内部和音节间的协同发音问题,大大提高了识别率;针对建模后三音子模型数量急剧增加问题,采用了决策树状态聚类方法,建立了一套二值问题规则集,并将语音学的专业知识融合进决策树,通过聚类减少了三音子模型的数量,有效地解决了训练数据不充分问题;鉴于倒谱均值归一化(CMN)方法在消除信道卷积噪声以及加性噪声方面的良好表现,在农产品市场信息语音识别系统中采用,有效缓解了信道噪声影响。(3)在信号空间,为了提高输入语音信号的信噪比,采用了谱减类算法进行语音增强,但谱减算法容易带来信道失真和“音乐”噪声。为了减少这种失真,提出了一种联合语音增强与特征补偿的鲁棒性方法,把倒谱均值方差归一化方法(CMVN)与谱减类算法进行了结合,二者互为补充。实验结果表明,联合后的算法能有效提高系统的识别率,特别是在低信噪比时效果更为明显。(4)在统计估计理论的框架下,研究了估计幅度与实际幅度的最小均方误差(MMSE)估计器以及对数最小均方误差(log MMSE)幅度估计器。在此基础上提出了一种联合MMSE以及log MMSE幅度估计与CMVN失真补偿的鲁棒性方法。不同农产品市场信息采集环境下的实验证明,该方法具有一定的噪声鲁棒性,多种空间算法的有机结合可以提供系统的鲁棒性,特别是在低信噪比时更为明显。本文的研究为语音识别在农产品市场信息采集环境中的应用建立了一套鲁棒性方法,为今后语音识别在农业信息采集领域的应用提供了借鉴。
【学位授予单位】:中国农业科学院
【学位授予年份】:2015
【分类号】:TN912.34
【目录】:
【参考文献】
中国期刊全文数据库 前10条
1 王易川;李智忠;;基于Mel倒谱和BP神经网络的船舶目标分类研究[J];传感器与微系统;2011年06期
2 郭海燕;杨震;朱卫平;;一种新的基于稀疏分解的单通道混合语音分离方法[J];电子学报;2012年04期
3 白立舜;杨伯钢;王晴;;森林资源调查的便携式野外声控记录技术研究[J];测绘通报;2013年09期
4 张雪英;贾海蓉;靳晨升;;子空间与维纳滤波相结合的语音增强方法[J];计算机工程与应用;2011年14期
5 刘放军;王仁华;;语音识别前端鲁棒性问题综述[J];计算机科学;2006年04期
6 王让定,柴佩琪;语音倒谱特征的研究[J];计算机工程;2003年13期
7 舒挺,张国煊;基于Voice XML技术的信息服务集成[J];计算机应用;2003年06期
8 王晓兰,周献中;格式正确的有限命令识别[J];计算机应用;2005年10期
9 雷建军;杨震;刘刚;郭军;;噪声鲁棒语音识别研究综述[J];计算机应用研究;2009年04期
10 张翠丽;张申生;李磊;;基于统一受理的农业呼叫中心解决方案[J];计算机应用与软件;2006年10期
中国博士学位论文全文数据库 前1条
1 胡郁;语音识别中基于模型补偿的噪声鲁棒性问题研究[D];中国科学技术大学;2009年
中国硕士学位论文全文数据库 前2条
1 李金娟;基于HMM模型的语音情感识别的研究[D];天津大学;2007年
2 周阿转;汽车驾驶环境中的鲁棒性语音识别[D];苏州大学;2012年
本文编号:168820
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/168820.html