基于波束赋形技术与V290pub语音模块的新型降噪语音识别系统
发布时间:2021-03-30 06:38
随着科技的发展,以人机交互模型为基础的语音识别系统正逐步融入于人们的生活当中,但是追溯之前的研究,语音识别在降噪处理方面仍存在一些不足。为了设计一种对环境噪声适应性强,能够无偏差地进行智能人机交互的系统,提出一种使用特殊抗噪处理的麦克风和基于波束赋形技术与V290pub语音模块的新型降噪语音识别系统。利用新型数字信号处理IC"BU8332KV-M"的波束赋形技术结合V290pub内置的抗噪声滤波器来实现在语音识别过程中的降噪处理。以STC89C52单片机为主控MCU,针对家电设备的实际需求来完成最终系统设计。实验结果表明,在嘈杂环境下新型降噪语音识别系统对比传统语音识别系统有更高的语音识别精度,且具备拒绝错误识别的功能,适用于存在环境噪声干扰的各种语音系统中。
【文章来源】:现代电子技术. 2020,43(10)北大核心
【文章页数】:5 页
【部分图文】:
0 新型抗噪语音识别系统
本文所涉及的波束赋形技术利用的是由两个麦克风产生的相位差来降低目标方向以外的语音,降低环境噪声,提高目标声源的清晰度。波束赋形技术之所以能形成指向性是因为其将指向轴转向了声源的方向,进而有效降低了环境的噪声。通过优化处理,运行波束赋形功能时延迟时间可以控制在10 ms以内,并且最大限度地减小对其他电路的影响。使用两个无指向性的麦克风形成波束赋形技术的BU8332KV-M的工作原理图如图1所示。通过实验检测,如图2所示,在环境噪声等级为65 dB SPL的环境下语音识别率从0%提高到了50%;在环境噪声等级为55 dB SPL的环境下语音识别率从10%提高到了90%;当语音识别率已经达到一定的水准之后想要继续提升是很困难的,但应用此芯片后在环境噪声等级为45 dB SPL的环境下语音识别率还能从80%提升到95%。由此可见,其对于噪声条件下的语音识别率提升作用显著。
传统的语音识别系统为:拼音串+51单片机+LD3320,但这其中存在诸多缺陷,例如识别指令少、识别距离短、没有误识别功能以及特定人识别功能,其中最为严重的缺陷便是抗噪能力差,因此就需要在此传统系统的基础上做出改进,选择V290pub替代LD3320就是重要改进之一。V290pub使用了最新的语音识别芯片技术,内置降噪模块和识别打分模块(用于提供错误拒绝识别功能),V290pub不仅具备离线识别功能,而且还能通过Uart送出语音流,方便上传到云端服务器进行识别,从而实现在线识别,同时降低“误识别”与“误触发”两类错误。V290pub较LD3320的升级:
【参考文献】:
期刊论文
[1]语音识别无线开关控制装置的设计[J]. 傅大梅,盛彬. 现代电子技术. 2017(14)
[2]低信噪比环境下的语音识别方法研究[J]. 王群,曾庆宁,谢先明,郑展恒. 声学技术. 2017(01)
[3]一种阵列天线快速波束赋形方法[J]. 王力,何丙发,孙庆锋. 现代雷达. 2016(08)
[4]基于双麦克风降噪技术的语音识别系统[J]. 潘丽杰,徐本亮,朱琪,王利峰,缪惠根. 现代电子技术. 2016(02)
[5]基于LD3320的语音识别智能垃圾桶设计[J]. 何侃,田亚清,李强,胡洲荣,张静. 国外电子测量技术. 2015(06)
[6]基于STC89C52的公交智能报站系统设计[J]. 涂朴. 现代电子技术. 2015(09)
[7]智能家居语音控制系统的设计[J]. 付蔚,唐鹏光,李倩. 自动化仪表. 2014(01)
本文编号:3109059
【文章来源】:现代电子技术. 2020,43(10)北大核心
【文章页数】:5 页
【部分图文】:
0 新型抗噪语音识别系统
本文所涉及的波束赋形技术利用的是由两个麦克风产生的相位差来降低目标方向以外的语音,降低环境噪声,提高目标声源的清晰度。波束赋形技术之所以能形成指向性是因为其将指向轴转向了声源的方向,进而有效降低了环境的噪声。通过优化处理,运行波束赋形功能时延迟时间可以控制在10 ms以内,并且最大限度地减小对其他电路的影响。使用两个无指向性的麦克风形成波束赋形技术的BU8332KV-M的工作原理图如图1所示。通过实验检测,如图2所示,在环境噪声等级为65 dB SPL的环境下语音识别率从0%提高到了50%;在环境噪声等级为55 dB SPL的环境下语音识别率从10%提高到了90%;当语音识别率已经达到一定的水准之后想要继续提升是很困难的,但应用此芯片后在环境噪声等级为45 dB SPL的环境下语音识别率还能从80%提升到95%。由此可见,其对于噪声条件下的语音识别率提升作用显著。
传统的语音识别系统为:拼音串+51单片机+LD3320,但这其中存在诸多缺陷,例如识别指令少、识别距离短、没有误识别功能以及特定人识别功能,其中最为严重的缺陷便是抗噪能力差,因此就需要在此传统系统的基础上做出改进,选择V290pub替代LD3320就是重要改进之一。V290pub使用了最新的语音识别芯片技术,内置降噪模块和识别打分模块(用于提供错误拒绝识别功能),V290pub不仅具备离线识别功能,而且还能通过Uart送出语音流,方便上传到云端服务器进行识别,从而实现在线识别,同时降低“误识别”与“误触发”两类错误。V290pub较LD3320的升级:
【参考文献】:
期刊论文
[1]语音识别无线开关控制装置的设计[J]. 傅大梅,盛彬. 现代电子技术. 2017(14)
[2]低信噪比环境下的语音识别方法研究[J]. 王群,曾庆宁,谢先明,郑展恒. 声学技术. 2017(01)
[3]一种阵列天线快速波束赋形方法[J]. 王力,何丙发,孙庆锋. 现代雷达. 2016(08)
[4]基于双麦克风降噪技术的语音识别系统[J]. 潘丽杰,徐本亮,朱琪,王利峰,缪惠根. 现代电子技术. 2016(02)
[5]基于LD3320的语音识别智能垃圾桶设计[J]. 何侃,田亚清,李强,胡洲荣,张静. 国外电子测量技术. 2015(06)
[6]基于STC89C52的公交智能报站系统设计[J]. 涂朴. 现代电子技术. 2015(09)
[7]智能家居语音控制系统的设计[J]. 付蔚,唐鹏光,李倩. 自动化仪表. 2014(01)
本文编号:3109059
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3109059.html