基于迁移学习优化的DCNN语音识别技术
发布时间:2021-10-07 06:41
针对现有语音识别技术识别精准度低的问题,提出一种基于深度卷积神经网络算法与迁移学习相结合的语音识别技术。由于深度卷积神经网络应用范围有限,当输入输出参数发生变化时,需要重新开始构建,体系结构训练时间过长,因此,采用迁移学习方法有利于降低数据集规模。仿真实验结果表明,迁移学习不仅适用于源数据集与迁移问题的目标数据集比较,而且也适用于两种不同数据集情况,小数据集应用不仅有利于降低数据集生成时间和费用,而且有利于降低模型培训时间和对计算能力的要求。
【文章来源】:现代电子技术. 2020,43(17)北大核心
【文章页数】:4 页
【部分图文】:
VGG-16的原理图
利用数据增强得到的图谱,通过人工放大数据来提高性能,对VGG-16模型的顶层进行训练。作为一个优化器,选择学习率为0.000 5的随机梯度下降优化器。该模型训练的批量大小为8的25,50,100和200个学时的音频数据,只有男性的声音、女性的声音和混合的男性和女性的声音,预先训练的学时数要接近或在训练饱和的范围内。总的准确度百分比的培训结果如表1所示。由表1可以看出:对于一个包含5 200个男性或女性声音文件的数据集,可以收到每个性别的语音测试结果。对于一个包含5 200个文件的数据集中男女声音的组合,培训无法取得可比的结果。但是一个包含2倍多文件(10 400个)的数据集不能只是达到单独培训的结果,它甚至优于单独培训的结果。也可以看出,对于所有的测试案例,超过25个学时的培训都不能完成的结果,可以通过50个或更高学时的培训获得。
不同数量冻结层对10 400个男性和女性声音文件集的训练精度
【参考文献】:
期刊论文
[1]基于迁移学习的类别级物体识别与检测研究与进展[J]. 张雪松,庄严,闫飞,王伟. 自动化学报. 2019(07)
[2]基于改进卷积神经网络算法的语音识别[J]. 杨洋,汪毓铎. 应用声学. 2018(06)
[3]基于卷积神经网络的路面裂缝检测[J]. 赵珊珊,何宁. 传感器与微系统. 2017(11)
[4]基于卷积神经网络的面罩语音识别[J]. 王霞,杜桂明,王光艳,张艳. 传感器与微系统. 2017(10)
[5]采用长短时记忆网络的低资源语音识别方法[J]. 舒帆,屈丹,张文林,周利莉,郭武. 西安交通大学学报. 2017(10)
[6]基于深度学习的语音识别技术现状与展望[J]. 戴礼荣,张仕良,黄智颖. 数据采集与处理. 2017(02)
[7]深度卷积神经网络的汽车车型识别方法[J]. 张军,张婷,杨正瓴,朱新山,杨伯轩. 传感器与微系统. 2016(11)
[8]深度学习:多层神经网络的复兴与变革[J]. 山世光,阚美娜,刘昕,刘梦怡,邬书哲. 科技导报. 2016(14)
[9]基于深度学习混合模型迁移学习的图像分类[J]. 石祥滨,房雪键,张德园,郭忠强. 系统仿真学报. 2016(01)
[10]深度学习的昨天、今天和明天[J]. 余凯,贾磊,陈雨强,徐伟. 计算机研究与发展. 2013(09)
本文编号:3421547
【文章来源】:现代电子技术. 2020,43(17)北大核心
【文章页数】:4 页
【部分图文】:
VGG-16的原理图
利用数据增强得到的图谱,通过人工放大数据来提高性能,对VGG-16模型的顶层进行训练。作为一个优化器,选择学习率为0.000 5的随机梯度下降优化器。该模型训练的批量大小为8的25,50,100和200个学时的音频数据,只有男性的声音、女性的声音和混合的男性和女性的声音,预先训练的学时数要接近或在训练饱和的范围内。总的准确度百分比的培训结果如表1所示。由表1可以看出:对于一个包含5 200个男性或女性声音文件的数据集,可以收到每个性别的语音测试结果。对于一个包含5 200个文件的数据集中男女声音的组合,培训无法取得可比的结果。但是一个包含2倍多文件(10 400个)的数据集不能只是达到单独培训的结果,它甚至优于单独培训的结果。也可以看出,对于所有的测试案例,超过25个学时的培训都不能完成的结果,可以通过50个或更高学时的培训获得。
不同数量冻结层对10 400个男性和女性声音文件集的训练精度
【参考文献】:
期刊论文
[1]基于迁移学习的类别级物体识别与检测研究与进展[J]. 张雪松,庄严,闫飞,王伟. 自动化学报. 2019(07)
[2]基于改进卷积神经网络算法的语音识别[J]. 杨洋,汪毓铎. 应用声学. 2018(06)
[3]基于卷积神经网络的路面裂缝检测[J]. 赵珊珊,何宁. 传感器与微系统. 2017(11)
[4]基于卷积神经网络的面罩语音识别[J]. 王霞,杜桂明,王光艳,张艳. 传感器与微系统. 2017(10)
[5]采用长短时记忆网络的低资源语音识别方法[J]. 舒帆,屈丹,张文林,周利莉,郭武. 西安交通大学学报. 2017(10)
[6]基于深度学习的语音识别技术现状与展望[J]. 戴礼荣,张仕良,黄智颖. 数据采集与处理. 2017(02)
[7]深度卷积神经网络的汽车车型识别方法[J]. 张军,张婷,杨正瓴,朱新山,杨伯轩. 传感器与微系统. 2016(11)
[8]深度学习:多层神经网络的复兴与变革[J]. 山世光,阚美娜,刘昕,刘梦怡,邬书哲. 科技导报. 2016(14)
[9]基于深度学习混合模型迁移学习的图像分类[J]. 石祥滨,房雪键,张德园,郭忠强. 系统仿真学报. 2016(01)
[10]深度学习的昨天、今天和明天[J]. 余凯,贾磊,陈雨强,徐伟. 计算机研究与发展. 2013(09)
本文编号:3421547
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3421547.html