深度学习语音合成技术研究
发布时间:2021-04-04 00:18
语音合成在人机交互中扮演着重要角色,伴随着深度学习的发展,语音合成也进入新的发展阶段。文章对基于深度学习的语音合成系统进行研究,总结分析深度学习语音合成特点,并详细介绍四个深度学习语音合成系统。这四个系统包含了单说话人、多说话人和任意说话人的语音合成,分析这些系统可以学习基于深度学习语音合成系统的原理,为研究人员提供重要的参考价值。
【文章来源】:计算机时代. 2020,(09)
【文章页数】:5 页
【部分图文】:
Wavenet模型
音频采样点通常比较大,采用普通卷积方式计算量非常大。对此,Wavenet引入了因果卷积,如图2所示,因果卷积可以在不增加计算复杂度同时增加卷积所关联的时间范围。因果卷积增大了卷积感受野,但需要较多的卷积层,这增大模型规模和计算复杂度。为此,Wavenet进一步采用了带洞卷积,如图3所示,带洞卷积每隔几个输入卷积,这样既增加卷积感受野也减少了卷积层数。
因果卷积增大了卷积感受野,但需要较多的卷积层,这增大模型规模和计算复杂度。为此,Wavenet进一步采用了带洞卷积,如图3所示,带洞卷积每隔几个输入卷积,这样既增加卷积感受野也减少了卷积层数。2.3 Wavenet声码器
本文编号:3117361
【文章来源】:计算机时代. 2020,(09)
【文章页数】:5 页
【部分图文】:
Wavenet模型
音频采样点通常比较大,采用普通卷积方式计算量非常大。对此,Wavenet引入了因果卷积,如图2所示,因果卷积可以在不增加计算复杂度同时增加卷积所关联的时间范围。因果卷积增大了卷积感受野,但需要较多的卷积层,这增大模型规模和计算复杂度。为此,Wavenet进一步采用了带洞卷积,如图3所示,带洞卷积每隔几个输入卷积,这样既增加卷积感受野也减少了卷积层数。
因果卷积增大了卷积感受野,但需要较多的卷积层,这增大模型规模和计算复杂度。为此,Wavenet进一步采用了带洞卷积,如图3所示,带洞卷积每隔几个输入卷积,这样既增加卷积感受野也减少了卷积层数。2.3 Wavenet声码器
本文编号:3117361
本文链接:https://www.wllwen.com/kejilunwen/wltx/3117361.html