当前位置:主页 > 科技论文 > 网络通信论文 >

语音增强技术研究及在语音识别中的应用

发布时间:2019-04-16 14:43
【摘要】:语音是生活中最重要的信息载体,然而它很容易受到噪声的污染,从而干扰信息的传递。语音增强,它能将重要的语音信号从嘈杂的带噪语音中分离出来,将噪声的影响尽可能地减少。语音识别技术在现实生活中应用越来越广泛,安静环境中的语音识别技术已经日趋成熟,而噪声环境下的语音识别技术仍然是一个难题。语音识别系统要实现抗噪就必须要尽量减少噪声的干扰,因此将语音增强技术结合到语音识别中来实现识别系统的抗噪性,具有很大的研究意义。本文的研究工作主要分成三个部分。第一,深入研究了几种传统的语音增强算法,包括谱减法、维纳滤波和最小均方误差估计算法,并在此研究基础上对这些算法进行了详细的仿真实验。基于实验的基础上,对比分析这些算法各自的优缺点,并从信噪比和语音失真两方面去评价这些语音增强方法。最后,对各种算法加以总结得出不同噪声要求的情况下比较合适的语音增强算法。第二,对语音识别技术进行了分析和比较研究,着重分析了预处理、端点检测等几个语音识别实现需要解决的关键性技术。在此基础上,我们实现了主流的动态时间规整和隐马尔可夫算法。从识别率上,对两种算法进行了分析,并实验比较了这些语音识别系统抗噪性的差异。第三,提出了一种基于语音增强技术的语音识别算法。该算法将语音增强与语音识别进行联合处理,即在识别之前先进行语音增强处理。实验证明,实现的语音识别系统具有良好的抗噪性。通过比较几种语音增强算法在语音识别上应用结果及分析,得出了语音识别应用中较好的语音增强算法。设计了一个多引擎的语音识别系统,该系统抗噪性和识别率上,都比传统的识别算法效果更出色。
[Abstract]:Speech is the most important information carrier in life. However, it is easy to be polluted by noise, which interferes with the transmission of information. Speech enhancement, which can separate important speech signals from noisy speech, and reduce the influence of noise as much as possible. Speech recognition technology is more and more widely used in real life. Speech recognition technology in quiet environment has become more and more mature, and speech recognition technology in noise environment is still a difficult problem. If speech recognition system is to resist noise, it is necessary to reduce noise interference as far as possible. Therefore, it is of great significance to combine speech enhancement technology with speech recognition to realize the anti-noise property of speech recognition system. The research work of this paper is divided into three parts. Firstly, several traditional speech enhancement algorithms, including spectral subtraction, Wiener filtering and least mean square error estimation (MMSE), are deeply studied, and detailed simulation experiments are carried out on the basis of this study. On the basis of experiments, the advantages and disadvantages of these algorithms are compared and analyzed, and the speech enhancement methods are evaluated from two aspects: signal-to-noise ratio (SNR) and speech distortion. Finally, various algorithms are summarized to get a more suitable speech enhancement algorithm under different noise requirements. Secondly, the speech recognition technology is analyzed and compared, and the key technologies to realize speech recognition, such as preprocessing and endpoint detection, are emphatically analyzed. On this basis, we implement the mainstream dynamic time regularization and hidden Markov algorithm. In terms of recognition rate, the two algorithms are analyzed, and the differences of anti-noise performance of these speech recognition systems are compared experimentally. Thirdly, a speech recognition algorithm based on speech enhancement technology is proposed. The algorithm combines speech enhancement with speech recognition, that is, speech enhancement before recognition. The experimental results show that the proposed speech recognition system has good anti-noise property. By comparing the application results and analysis of several speech enhancement algorithms in speech recognition, a better speech enhancement algorithm in speech recognition application is obtained. A multi-engine speech recognition system is designed. The anti-noise performance and recognition rate of the system are better than the traditional recognition algorithm.
【学位授予单位】:福州大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TN912.3

【相似文献】

相关期刊论文 前10条

1 郭远琼;提高语音识别率点滴[J];电脑技术;2000年03期

2 邢文;语音识别[J];个人电脑;2000年02期

3 ;语音识别的真相[J];个人电脑;2001年12期

4 ;语音识别渐入佳境[J];个人电脑;2002年03期

5 ;微软语音识别软件可与人直接对话[J];自动化博览;2003年04期

6 ;语音识别[J];印刷世界;2004年01期

7 杰里米·瓦格斯塔夫;让语音识别软件 解放你的双手[J];农业图书情报学刊;2004年03期

8 韩纪庆,王欢良,李海峰,郑铁然;基于语音识别的发音学习技术[J];电声技术;2004年09期

9 陈孝强;语音识别拟起新潮[J];微电脑世界;2005年07期

10 韩纪庆;张磊;郑铁然;;网络环境下的语音识别方法[J];计算机科学;2005年01期

相关会议论文 前10条

1 张歆奕;吴今培;张其善;;语音的共性特征及其在语音识别中的应用[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年

2 杜树木;何良华;;一种新的基于段长分布的语音识别模型[A];2009年通信理论与信号处理学术年会论文集[C];2009年

3 李桢;高万林;欧文浩;徐山川;;基于关键词语音识别的农业信息语音服务系统的研究与实现[A];中国农业工程学会电气信息与自动化专业委员会、中国电机工程学会农村电气化分会科技与教育专委会2010年学术年会论文摘要[C];2010年

4 张冰;龙长才;罗海风;;熟悉掩蔽音背景下的目标语音识别[A];泛在信息社会中的声学——中国声学学会2010年全国会员代表大会暨学术会议论文集[C];2010年

5 王承发;赵德彬;金山;苗百利;朱志莹;;语音识别应用中抗噪声干扰方法的初步探讨[A];第二届全国人机语音通讯学术会议论文集[C];1992年

6 杜笑平;杨启纲;杨家沅;;过零周期转移概率矩阵语音识别部件的研制[A];第二届全国人机语音通讯学术会议论文集[C];1992年

7 季宏;刘志文;杜燕玲;黄曾阳;;语音识别中的音字转换[A];第三届全国人机语音通讯学术会议论文集[C];1994年

8 葛余博;杨大利;曾德超;;噪声环境下语音识别的几个问题(一)[A];第三届全国人机语音通讯学术会议论文集[C];1994年

9 朱奇峰;俞铁城;;听觉中的协同现象和其对语音识别影响的探讨[A];第四届全国人机语音通讯学术会议论文集[C];1996年

10 姚磊;黄泰翼;陈景东;;一种高鲁棒性语音识别的通用自适应方法研究[A];第四届全国人机语音通讯学术会议论文集[C];1996年

相关重要报纸文章 前10条

1 黄梦;方案商积极切入语音识别市场[N];电脑商报;2006年

2 闫婷;语音识别 理想与现实的距离[N];计算机世界;2007年

3 刘喜喜;语音识别将把鼠标键盘打入冷宫?[N];中国计算机报;2008年

4 乐天;语音识别:让你的手机更聪明[N];计算机世界;2011年

5 特约作者 王佳彬;语音识别渐入佳境[N];电脑报;2002年

6 雨夏;语音识别重在应用[N];计算机世界;2001年

7 ;语音识别企业应用前景光明[N];计算机世界;2003年

8 王向东 栾焕博 林守勋 钱跃良;语音识别:抗噪音能力有待加强[N];计算机世界;2006年

9 上海 高博;让电脑“听懂”人话[N];电脑报;2008年

10 张彤;语音识别融入统一通信[N];网络世界;2008年

相关博士学位论文 前10条

1 许金普;农产品市场信息采集的语音识别鲁棒性方法研究[D];中国农业科学院;2015年

2 包希日莫;面向蒙古语的语音识别声学建模研究[D];内蒙古大学;2016年

3 吴斌;语音识别中的后处理技术研究[D];北京邮电大学;2008年

4 奉小慧;音频噪声环境下唇动信息在语音识别中的应用技术研究[D];华南理工大学;2010年

5 孙f,

本文编号:2458860


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/2458860.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户eb3c2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com