智慧家庭环境下语音交互系统的设计与实现
发布时间:2022-01-15 08:37
近年来,为了满足人们对智能家居设备便捷化的控制需求,智能语音软件和交互设备逐渐走进了人们的家庭生活。现有软件和设备的语音识别功能都基于云端完成,存在无法离线使用、占用网络带宽、隐私泄露等问题。论文对语音识别理论展开研究,设计和实现了智慧家庭环境下基于语音的自然人机交互系统。系统包含两个部分,关键词识别系统和大词汇量连续中文语音识别系统。关键词识别系统用于设备唤醒和短指令识别,在资源受限的微控制器端运行。论文从参数量、识别率和推理阶段计算量三个方面,研究和比较了深度全连接神经网络、卷积神经网络和深度可分离卷积神经网络在关键词识别任务中的应用。为了实现关键词识别模型在微控制器端的部署,论文使用动态定点量化进一步降低模型存储需求,同时使用SIMD指令加速模型在微控制器端的推理运算。大词汇量连续中文语音识别系统用于长语句识别,运行在搭载Intel Movidius神经网络计算棒的控制中心节点。本文的端到端连续语音识别模型能够直接将音频转为文本,无需中间音素表示。模型结合卷积神经网络、双向长短时记忆神经网络和连接时序分类,在输入梅尔频率倒谱系数特征序列与输出拼音序列之间建立映射关系,并使用N-g...
【文章来源】:华中科技大学湖北省 211工程院校 985工程院校 教育部直属院校
【文章页数】:86 页
【学位级别】:硕士
【部分图文】:
关键词识别系统整体结构
华 中 科 技 大 学 硕 士 学 位 论 文5 实验结果与分析庭环境下语音交互系统实验平台搭建平台主要包括四个部分: 可穿戴节点:可穿戴节点如图 5-1 所示,节点运行关键词识别系统。词 识 别 系 统 前 期 的 开 发 和 测 试 都 是 在 恩 智 浦 官 方 推MIMXRT1050-EVK:i.MX RT1052 开发板上完成,如图 5-1 中(a)仅集成关键词识别系统所需硬件的实物图如图 5-2 中(b)所示,大为 3×4 厘米,WIFI 模块使用 Cypress CYW4343W 芯片。
图 5-2 控制中心节点:被控节点如图 5-3 中的 A、B 所示。被控节点,由主控(STM32F103RET6)、射频模块(M模块(BL9193-33 和 TP4056)组成,通过绿色
【参考文献】:
期刊论文
[1]走过智能音箱“元年”[J]. 马振贵. 上海信息化. 2018(02)
[2]一种基于自适应谱熵的端点检测改进方法[J]. 王琳,李成荣. 计算机仿真. 2010(12)
本文编号:3590290
【文章来源】:华中科技大学湖北省 211工程院校 985工程院校 教育部直属院校
【文章页数】:86 页
【学位级别】:硕士
【部分图文】:
关键词识别系统整体结构
华 中 科 技 大 学 硕 士 学 位 论 文5 实验结果与分析庭环境下语音交互系统实验平台搭建平台主要包括四个部分: 可穿戴节点:可穿戴节点如图 5-1 所示,节点运行关键词识别系统。词 识 别 系 统 前 期 的 开 发 和 测 试 都 是 在 恩 智 浦 官 方 推MIMXRT1050-EVK:i.MX RT1052 开发板上完成,如图 5-1 中(a)仅集成关键词识别系统所需硬件的实物图如图 5-2 中(b)所示,大为 3×4 厘米,WIFI 模块使用 Cypress CYW4343W 芯片。
图 5-2 控制中心节点:被控节点如图 5-3 中的 A、B 所示。被控节点,由主控(STM32F103RET6)、射频模块(M模块(BL9193-33 和 TP4056)组成,通过绿色
【参考文献】:
期刊论文
[1]走过智能音箱“元年”[J]. 马振贵. 上海信息化. 2018(02)
[2]一种基于自适应谱熵的端点检测改进方法[J]. 王琳,李成荣. 计算机仿真. 2010(12)
本文编号:3590290
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3590290.html