当前位置:主页 > 科技论文 > 信息工程论文 >

分布式智能语音开关阵列研究与实现

发布时间:2020-09-05 08:25
   随着科技的不断发展和进步,语音识别技术也得到了相应的发展。语音识别的性能也得到了进一步的提升,识别速率越来越快,识别率也越来越高。语音识别系统作为一种方便、快捷、高效的人机交互方式,越来越引起人们的重视。但在实际的应用场景中,语音识别往往受到识别环境和训练环境的影响,导致识别性能急剧下降。因此,提高语音识别在噪声环境下的识别率和识别速度越来越受到关注,这也是语音识别系统走出实验室,应用到人们生活的关键所在。为了弥补传统方法的弊端,本论文将分布式技术以及无线组网技术结合起来,开发出一款带有优先级的开关阵列设计,能够广泛应用于居家环境。开关阵列将语音信号通过网关上传到服务器端进行相应的语音信号处理,极大的提高了处理效率。同时,考虑到使用现场存在着诸多的噪声,有效的语音信号通常夹杂着大量的环境噪声,本论文采用五麦克风来进行降噪处理。当多个麦克风阵列同时存在时,可以通过时延估计算法精确到某个特定的麦克风阵列,确定语音信号源到达麦克风的先后顺序,来定位出声源位置来确保控制目标对象的一致性,并可以通过Wi-Fi来对其他开关进行同步分析,从而判断采集到的命令是首次命令还是因反射而造成的误判,并相应的执行操作。同时,本文还对麦克风阵列的信号模型进行了研究,其中包括近场模型、远场模型以及五麦克风阵列的几何模型。并分析设计了一种适合语音开关阵列的基于隐马尔可夫模型关键词识别算法的改进方案。在端点检测阶段,采用根据音节来对端点进行提取,同时将这些起始点按照数组的形式进行保存。在参数提取、模板训练以及模板匹配的阶段,利用参考模板以及维特比算法对n个音节的MFCC参数进行匹配,通过与阈值的比较来判断是否为关键词。最后,进行一系列的对比试验,分别对麦克风的摆放位置、语音信号源的距离角度对结果的影响,并在Matlab下进行了识别的仿真试验。
【学位单位】:杭州电子科技大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:TN912.34
【部分图文】:

采样量化,语音信号,后波,噪声


散信号的过程。因为人说话的频率主要集中在3.4KHZ以下,因而大部分的信息均在这个频率逡逑以内,所以根据奎斯特采样定律,只需要使采样频率4笥诹奖叩挠镆粜藕诺淖畲笃德示涂桑]3?以无失真的还原出原始的语音信号。一般频率取8KHz或者16KHz即可,而高保真的立体音逡逑乐的采样频率会更加高一些。下图2.1主要展示了在8KHz下的抽样频率以及进行16位量化逡逑编码的语音数据。在对语音信号进行采样前一般都采用低通滤波对语音信号进行滤波,这样逡逑就可以有效的限制高频成分,防止在采集过程中采集到超过采样频率一半的语音信号,这样逡逑有效的防止了信号的混淆和干扰。低通滤波信号如下图2.2所示,采样数据的量化能够将采逡逑样信号用离散数据信号来代替,这样也方便了计算机的存储。通常情况下,一般采用8位、逡逑16位或者32位甚至更高的位数来对模拟语音信号进行量化,本次课题采用的是16位的数据逡逑编码[9]。逡逑抽样量化信号(8000Hz,16bit)逡逑I逦i逦:逦^逦i逦n逦!逦■逦!逦?逡逑^逦i逡逑0.05邋r逦H|逡逑:丨f逡逑-0.15?

傅里叶逆变换,语音增强,低通滤波,正变换


散信号的过程。因为人说话的频率主要集中在3.4KHZ以下,因而大部分的信息均在这个频率逡逑以内,所以根据奎斯特采样定律,只需要使采样频率4笥诹奖叩挠镆粜藕诺淖畲笃德示涂桑]3?以无失真的还原出原始的语音信号。一般频率取8KHz或者16KHz即可,而高保真的立体音逡逑乐的采样频率会更加高一些。下图2.1主要展示了在8KHz下的抽样频率以及进行16位量化逡逑编码的语音数据。在对语音信号进行采样前一般都采用低通滤波对语音信号进行滤波,这样逡逑就可以有效的限制高频成分,防止在采集过程中采集到超过采样频率一半的语音信号,这样逡逑有效的防止了信号的混淆和干扰。低通滤波信号如下图2.2所示,采样数据的量化能够将采逡逑样信号用离散数据信号来代替,这样也方便了计算机的存储。通常情况下,一般采用8位、逡逑16位或者32位甚至更高的位数来对模拟语音信号进行量化,本次课题采用的是16位的数据逡逑编码[9]。逡逑抽样量化信号(8000Hz,16bit)逡逑I逦i逦:逦^逦i逦n逦!逦■逦!逦?逡逑^逦i逡逑0.05邋r逦H|逡逑:丨f逡逑-0.15?

频谱图,预加重,语音信号,频谱图


时间邋t/ms逦*ic逡逑图2.3小波去噪前的语音信号逡逑小波去嗓之后的语音信号逡逑I邋i逦i邋I邋I逦I逦!逦1逦!逡逑0.邋-逦I邋,逦*逡逑_逦.Hi逡逑射逦-逡逑43.4逦i逦^i逦?逦?逦!逦?逦1逦逡逑1逦1.1逦1.2逦1,3逦1.4逦1.5逦1.6逦1.7逦1.S逦19逦2逡逑时间邋fjins逦x18逡逑图2.4小波去噪后的语音信号逡逑2.1.3语音信号预加重逡逑减轻口唇辐射效应所造成的干扰以及增强语音信号的高频部分这些都是预加重的主要目逡逑的,通过预加重可以有效的提高高频部分的分辨率。逡逑语音信号的预加重通过利用//0)邋=邋1-oz-1这一传递函数的一阶HR数字高通滤波器来实逡逑现,在公式中^表示预加重系数,0.9邋<0;<邋1.0。如果语音信号在《这一时刻的懫样值可以表逡逑示为x(?),经过预加重处理之后的语音信号可以表不为_y(?)邋=邋x(/7)-ox(?-l),这里可以将a逡逑的值设定为0.98。下图2.5表示的是语音信号预加重前的频谱图,下图2.6表示的是预加重后逡逑的频谱图。逡逑_逦原始语音信号频域波形逡逑10邋逦i逦i逦!逦r逦i逦!逦;逦逡逑|邋5-邋J逦Ji邋I逦-逡逑甚逦J邋J邋|逦11邋|y逡逑0逦500逦1000逦1500逦2000逦2500逦3000逦3500逦4000逡逑频率f/Hz逡逑图2.5语音信号预加重前的频谱图逡逑9逡逑

【参考文献】

相关期刊论文 前10条

1 祁洁;温秀兰;徐波;苏冬;徐雄飞;;噪声环境下照明语音识别系统的研究与设计[J];计量与测试技术;2015年07期

2 刘荣辉;彭世国;刘国英;;基于智能家居控制的嵌入式语音识别系统[J];广东工业大学学报;2014年02期

3 于俊婷;刘伍颖;易绵竹;李雪;李娜;;国内语音识别研究综述[J];计算机光盘软件与应用;2014年10期

4 戴礼荣;张仕良;;深度语音信号与信息处理:研究进展与展望[J];数据采集与处理;2014年02期

5 柯登峰;徐波;;互联网时代语音识别基本问题[J];中国科学:信息科学;2013年12期

6 禹琳琳;;语音识别技术及应用综述[J];现代电子技术;2013年13期

7 田莎莎;唐菀;佘纬;;改进MFCC参数在非特定人语音识别中的研究[J];科技通报;2013年03期

8 徐子豪;张腾飞;;基于语音识别和无线传感网络的智能家居系统设计[J];计算机测量与控制;2012年01期

9 童强;黄剑;王永骥;;浴室噪声环境下小词汇量语音识别系统研究[J];华中科技大学学报(自然科学版);2011年S2期

10 于向丽;吕成国;;近场声源定位算法研究[J];智能计算机与应用;2011年05期

相关硕士学位论文 前3条

1 刘文强;语音识别技术在智能家居中的研究与应用[D];大连海事大学;2013年

2 陈程;基于HMM的语音识别系统研究[D];中南大学;2008年

3 吴为招;基于SPCE061A的嵌入式语音地图的研究与实现[D];厦门大学;2007年



本文编号:2812792

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/2812792.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户68fd0***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com