基于时间卷积网络的深度聚类说话人语音分离
发布时间:2021-05-20 01:43
"鸡尾酒会问题"在语音分离任务上一直是一个难题,主要因为这个问题属于一个说话人无关的语音分离问题,对于说话人事先不知道其先验信息。通过参考Jonathan等提出的深度聚类方法,在其基础上进行改进,提出基于时间卷及网络的深度聚类模型,以理想二值掩蔽作为分离目标并在公开中文语音数据集下进行实验。实验结果表明,相比传统深度聚类模型,所提模型在训练速度、分离后的语音质量和语音客观可懂度方面都得到了提升。
【文章来源】:计算机工程与设计. 2020,41(09)北大核心
【文章页数】:6 页
【文章目录】:
0 引 言
1 相关研究现状
2 特征提取、分离模型与分离目标
2.1 特征提取
2.2 基于时间卷积网络的深度聚类模型
2.3 分离目标
3 实验与结果分析
3.1 数据来源
3.2 数据预处理
3.3 网络参数
3.4 评价标准
3.5 结果与分析
4 结束语
本文编号:3196833
【文章来源】:计算机工程与设计. 2020,41(09)北大核心
【文章页数】:6 页
【文章目录】:
0 引 言
1 相关研究现状
2 特征提取、分离模型与分离目标
2.1 特征提取
2.2 基于时间卷积网络的深度聚类模型
2.3 分离目标
3 实验与结果分析
3.1 数据来源
3.2 数据预处理
3.3 网络参数
3.4 评价标准
3.5 结果与分析
4 结束语
本文编号:3196833
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3196833.html