面向物端芯片的语音关键词识别技术
发布时间:2021-05-19 23:59
随着物联网时代的到来,物端产品已经逐渐的走进了人们的生活中,其中语音关键词识别技术可以在物端产品中扮演重要的作用。因为人们可以完全免手动的方式和物端设备进行交互,但由于物端设备的算力和内存都有限,而语音关键词识别技术往往模型大、数据运算量高,因此语音关键词识别方案很难应用到物端产品。本文的目的是设计一个面向物端芯片的语音关键词识别方案,为了解决语音关键词识别技术模型大、运算量高等问题,本文提出了模型算法优化、指令优化、模型压缩和算法映射等方法,最终该语音关键词识别方案满足物端设备的高精度、低功耗、小内存占用和低计算量等要求。本文的主要工作内容如下:(1)为了减轻复杂环境中的噪声干扰,本文语音关键词识别算法的预处理阶段采用了声源定位和声源分离等算法来实现降噪,然后用梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)对语音信号进行特征提取,最后把预处理算法移植到RI5CY处理器中,并根据RISC-V的拓展指令集对预处理算法进行优化。(2)为了降低语音关键词识别算法的开销和提高算法的精度,本文的语音关键词网络为一个端到端的网络结构,该网络结构...
【文章来源】:中国科学院大学(中国科学院大学人工智能学院)北京市
【文章页数】:72 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.2.1 关键词识别技术的研究进展
1.2.2 物端芯片的研究进展
1.3 本文主要研究内容
第2章 面向物端开源处理器的语音信号预处理
2.1 预处理算法选择
2.1.1 声源定位
2.1.2 声源分离
2.2 面向RISC-V微控制器单元的算法移植和优化
2.2.1 算法移植
2.2.2 指令优化
2.3 小结
第3章 面向物端专用人工智能处理器的关键词识别方案实现
3.1 低开销关键词识别算法选取和性能优化
3.2 关键词识别算法模型量化
3.3 面向专用人工智能处理器的算法映射与性能优化
3.3.1 算法映射
3.3.2 性能优化
3.3.3 性能分析
3.4 小结
第4章 实验及结果分析
4.1 关键词识别技术方案的测试
4.1.1 关键词识别技术方案的训练过程
4.1.2 关键词识别技术方案的推理过程
4.1.3 关键词识别技术方案的超参数测试以及分析
4.2 关键词识别方案在专用人工智能处理器上的性能分析
4.2.1 物端计算引擎
4.2.2 神经网络硬件加速器
4.2.3 性能分析
4.3 小结
第5章 结论与展望
5.1 结论
5.2 展望
参考文献
致谢
作者简历及攻读学位期间发表的学术论文与研究成果
【参考文献】:
期刊论文
[1]基于深度神经压缩的YOLO加速研究[J]. 陈莉君,李卓. 现代计算机(专业版). 2019(11)
[2]基于正太分布离群算法的冷链温度监测系统[J]. 冯旭. 闽西职业技术学院学报. 2019(01)
[3]结合瓶颈特征的注意力声学模型[J]. 龙星延,屈丹,张文林. 计算机科学. 2019(01)
[4]基于双向长短时记忆-联结时序分类和加权有限状态转换器的端到端中文语音识别系统[J]. 姚煜,RYAD Chellali. 计算机应用. 2018(09)
硕士论文
[1]嵌入式深度神经网络的模型压缩与前向加速技术研究[D]. 丁杰.中国科学技术大学 2018
本文编号:3196680
【文章来源】:中国科学院大学(中国科学院大学人工智能学院)北京市
【文章页数】:72 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.2.1 关键词识别技术的研究进展
1.2.2 物端芯片的研究进展
1.3 本文主要研究内容
第2章 面向物端开源处理器的语音信号预处理
2.1 预处理算法选择
2.1.1 声源定位
2.1.2 声源分离
2.2 面向RISC-V微控制器单元的算法移植和优化
2.2.1 算法移植
2.2.2 指令优化
2.3 小结
第3章 面向物端专用人工智能处理器的关键词识别方案实现
3.1 低开销关键词识别算法选取和性能优化
3.2 关键词识别算法模型量化
3.3 面向专用人工智能处理器的算法映射与性能优化
3.3.1 算法映射
3.3.2 性能优化
3.3.3 性能分析
3.4 小结
第4章 实验及结果分析
4.1 关键词识别技术方案的测试
4.1.1 关键词识别技术方案的训练过程
4.1.2 关键词识别技术方案的推理过程
4.1.3 关键词识别技术方案的超参数测试以及分析
4.2 关键词识别方案在专用人工智能处理器上的性能分析
4.2.1 物端计算引擎
4.2.2 神经网络硬件加速器
4.2.3 性能分析
4.3 小结
第5章 结论与展望
5.1 结论
5.2 展望
参考文献
致谢
作者简历及攻读学位期间发表的学术论文与研究成果
【参考文献】:
期刊论文
[1]基于深度神经压缩的YOLO加速研究[J]. 陈莉君,李卓. 现代计算机(专业版). 2019(11)
[2]基于正太分布离群算法的冷链温度监测系统[J]. 冯旭. 闽西职业技术学院学报. 2019(01)
[3]结合瓶颈特征的注意力声学模型[J]. 龙星延,屈丹,张文林. 计算机科学. 2019(01)
[4]基于双向长短时记忆-联结时序分类和加权有限状态转换器的端到端中文语音识别系统[J]. 姚煜,RYAD Chellali. 计算机应用. 2018(09)
硕士论文
[1]嵌入式深度神经网络的模型压缩与前向加速技术研究[D]. 丁杰.中国科学技术大学 2018
本文编号:3196680
本文链接:https://www.wllwen.com/kejilunwen/dianzigongchenglunwen/3196680.html