基于平均教师模型的弱标记半监督声音事件检测
发布时间:2021-02-03 11:11
为了利用大量不平衡和未标记数据,采用一致性正则化思想的平均教师模型用于弱标记半监督声音事件检测,可有效减少半监督学习中的过拟合问题.在教师模型的权重更新过程中,首次提出将随机加权平均算法(SWA)用于声音事件检测,可以加快预测速度并且节约成本.针对模型的架构问题,采用改进的门控卷积长短时记忆网络(GCLSTM)作为学生模型和教师模型,其中全局加权秩池化层可以克服平均池化和最大池化对声音事件的低估和高估的限制,有效地提高系统的性能.在对数据进行特征提取过程中,采用SpecAugment策略对语谱图进行增强,从而有效地解决过拟合问题.为了评估实验方法,在声学场景和事件的检测及分类(DCASE)2018挑战任务4数据集上进行测试,结果表明:评估集的平均F1分数可达24.9%,明显优于基线系统和其他方法的F1分数.
【文章来源】:复旦学报(自然科学版). 2020,59(05)北大核心
【文章页数】:11 页
【文章目录】:
1 研究背景
2 基于平均教师模型的声音事件检测模型
2.1 平均教师模型
2.2 GCLSTM网络结构
2.3 随机加权平均
2.4 数据增强
3 实验
3.1 数据集
3.2 实验设置
3.3 实验结果与分析
3.3.1 各模型中每个声音事件的F1分数
3.3.2 域内未标记数据对结果的影响
3.3.3 讨论
4 结语
本文编号:3016406
【文章来源】:复旦学报(自然科学版). 2020,59(05)北大核心
【文章页数】:11 页
【文章目录】:
1 研究背景
2 基于平均教师模型的声音事件检测模型
2.1 平均教师模型
2.2 GCLSTM网络结构
2.3 随机加权平均
2.4 数据增强
3 实验
3.1 数据集
3.2 实验设置
3.3 实验结果与分析
3.3.1 各模型中每个声音事件的F1分数
3.3.2 域内未标记数据对结果的影响
3.3.3 讨论
4 结语
本文编号:3016406
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3016406.html