深度学习语音合成技术研究

发布时间：2021-04-04 00:18

　　语音合成在人机交互中扮演着重要角色,伴随着深度学习的发展,语音合成也进入新的发展阶段。文章对基于深度学习的语音合成系统进行研究,总结分析深度学习语音合成特点,并详细介绍四个深度学习语音合成系统。这四个系统包含了单说话人、多说话人和任意说话人的语音合成,分析这些系统可以学习基于深度学习语音合成系统的原理,为研究人员提供重要的参考价值。

【文章来源】：计算机时代. 2020,(09)

【文章页数】：5 页

【部分图文】：

深度学习语音合成技术研究

Wavenet模型

因果图,卷积,因果

音频采样点通常比较大，采用普通卷积方式计算量非常大。对此，Wavenet引入了因果卷积，如图2所示，因果卷积可以在不增加计算复杂度同时增加卷积所关联的时间范围。因果卷积增大了卷积感受野，但需要较多的卷积层，这增大模型规模和计算复杂度。为此，Wavenet进一步采用了带洞卷积，如图3所示，带洞卷积每隔几个输入卷积，这样既增加卷积感受野也减少了卷积层数。

卷积,感受野

因果卷积增大了卷积感受野，但需要较多的卷积层，这增大模型规模和计算复杂度。为此，Wavenet进一步采用了带洞卷积，如图3所示，带洞卷积每隔几个输入卷积，这样既增加卷积感受野也减少了卷积层数。2.3 Wavenet声码器

本文编号：3117361

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/wltx/3117361.html

上一篇：软件定义多维光网络研究进展与展望
下一篇：PDCA法下高校工科专业课程思政教育的探索——以通信网基础课程为例

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|