人工智能飞行副驾驶语音识别技术研究

发布时间：2024-04-22 18:53

　　语音识别技术作为人机交互的一部分,对于实现机器智能化至关重要。将机器人作为民用飞机的副驾驶是民航业未来重大突破和创新的方向,语音识别技术应用在机器人副驾驶上可以使机长的命令直接送达副驾驶程序中,使得机长和机器人副驾驶配合成为可能。语音库是实现语音识别的基础,目前研究学者们在做关于中文语音识别所用到的语料库大多是清华大学所公开的,但是该语音库不适合特定的研究方向。当下语音识别方式分为传统语音识别方式和端到端的语音识别方式,传统语音识别方式发展成熟,识别效果好,但是程序太过繁琐。针对以上背景,本论文以A320机型驾驶舱的监控飞行员与把杆飞行员之间的标准喊话为基准,建立了标准喊话语音库,然后应用端到端的语音识别方法——基于CTC的语音识别方法搭建识别模型。论文首先对机器人作为飞机副驾驶需要经历的过程、传统语音识别方式和端到端的语音识别方式的原理及过程、循环神经网络和语音库进行了详细的总结与阐述。其次建立了标准喊话语音库,语音库特征为:包含22条标准喊话,并将22条标准喊话分成了六组,录制语言为普通话,录制语音库的样本人数为150人,全部来自于中国民用航空飞行学院,他们具有民航专业背景,并且普...

【文章页数】：100 页

【学位级别】：硕士

【部分图文】：

图2.1识别过程

第2章人工智能飞行副驾驶语音识别基本理论8图2.1识别过程2.1.2决定决定阶段依据识别部分分为两部分。一部分是依据语音识别系统得到的标准喊话命令和其他通过输入设备传达的指令，例如标准喊话中到具体飞行阶段计算出该做的动作，标准喊话有一条“进近检查单”，当副驾驶机器人识别出这条来自....

图2.2决定过程和动作过程

中国民用航空飞行学院硕士学位论文9图2.2决定过程和动作过程2.2人工智能飞行副驾驶语音识别方法2.2.1语音信号特征提取语音信号特征提取在语音识别技术中是前期处理语音的过程，无论是传统语音识别方法还是本论文用到的端到端的语音识别方式，都应用此过程。语音信号特征提取由语音信号预处....

图2.3预加重幅度对比图

第2章人工智能飞行副驾驶语音识别基本理论10图2.3预加重幅度对比图然后对语音进行分帧，处理语音时，语音信号必须是平稳的，显而易见，一整段语音不具有平稳性，因此需要将整段语音分成10到30毫秒具有平稳性的信号，第一组标准喊话第10帧的如图2.4所示。图2.4第一组标准喊话第10帧....

图2.4第一组标准喊话第10帧示意图

第2章人工智能飞行副驾驶语音识别基本理论10图2.3预加重幅度对比图然后对语音进行分帧，处理语音时，语音信号必须是平稳的，显而易见，一整段语音不具有平稳性，因此需要将整段语音分成10到30毫秒具有平稳性的信号，第一组标准喊话第10帧的如图2.4所示。图2.4第一组标准喊话第10帧....

本文编号：3962122

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/rengongzhinen/3962122.html

上一篇：喷气涡流纺（MVS）成纱结构及其织物性能的研究
下一篇：共识规则下的货币演化逻辑与法定数字货币的人工智能发行

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|