当前位置:主页 > 科技论文 > 网络通信论文 >

深度学习语音合成技术研究

发布时间:2021-04-04 00:18
  语音合成在人机交互中扮演着重要角色,伴随着深度学习的发展,语音合成也进入新的发展阶段。文章对基于深度学习的语音合成系统进行研究,总结分析深度学习语音合成特点,并详细介绍四个深度学习语音合成系统。这四个系统包含了单说话人、多说话人和任意说话人的语音合成,分析这些系统可以学习基于深度学习语音合成系统的原理,为研究人员提供重要的参考价值。 

【文章来源】:计算机时代. 2020,(09)

【文章页数】:5 页

【部分图文】:

深度学习语音合成技术研究


Wavenet模型

因果图,卷积,因果


音频采样点通常比较大,采用普通卷积方式计算量非常大。对此,Wavenet引入了因果卷积,如图2所示,因果卷积可以在不增加计算复杂度同时增加卷积所关联的时间范围。因果卷积增大了卷积感受野,但需要较多的卷积层,这增大模型规模和计算复杂度。为此,Wavenet进一步采用了带洞卷积,如图3所示,带洞卷积每隔几个输入卷积,这样既增加卷积感受野也减少了卷积层数。

卷积,感受野


因果卷积增大了卷积感受野,但需要较多的卷积层,这增大模型规模和计算复杂度。为此,Wavenet进一步采用了带洞卷积,如图3所示,带洞卷积每隔几个输入卷积,这样既增加卷积感受野也减少了卷积层数。2.3 Wavenet声码器


本文编号:3117361

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/3117361.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户98409***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com