基于WaveNet结构的普通话歌声合成的研究

发布时间：2021-09-11 16:47

　　歌声,是通过人类嗓音所表达的音乐形式,也是人类语音最富有表现力的表达方式。歌声合成（Singing Voice Synthesis,SVS）是指利用语音合成相关技术,让计算机能够像人一样发出优美动听的歌声。歌声合成作为语音合成技术一个新的应用领域,在虚拟歌手、唱片制作、数字音乐创作等领域都有相当大的应用价值和前景。随着近年来研究者对语音合成技术研究的深入,对歌声合成方法的研究也有了一定进展,但还没有针对普通话歌声合成方法进行深入的研究。由于歌声合成比单纯的语音合成更侧重于对旋律的演绎,而且增加了关于歌曲信息的处理过程,比如节奏、调性等信息,因此歌声合成比语音合成具有更大的挑战性。本文研究了基于统计参数模型的歌声合成算法,在现有普通话语音合成和歌声合成的基础上,提出了一种改良的基于WaveNet结构的普通话歌声合成模型,能够用小的训练语料获得较好的歌声合成效果。本文的主要工作和创新如下:1.建立了一个面向普通话歌声合成的歌声语料库。根据歌曲的节奏、调性等特点,选择了90首歌曲的音乐可扩展标记语言（Music Extensible Markup Language,MusicXML）格式乐谱...

【文章来源】：西北师范大学甘肃省

【文章页数】：51 页

【学位级别】：硕士

【部分图文】：

歌声合成示意图

基于WaveNet结构的普通话歌声合成的研究

歌声语料标注样例

基于WaveNet结构的普通话歌声合成的研究

乐谱分析流程图

【参考文献】：
期刊论文
[1]面向汉语统计参数语音合成的标注生成方法[J]. 郝东亮,杨鸿武,张策,张帅,郭立钊,杨静波. 计算机工程与应用. 2016(19)

博士论文
[1]基于神经网络的统计参数语音合成方法研究[D]. 胡亚军.中国科学技术大学 2018
[2]基于统计模型的汉语歌声合成研究[D]. 李贤.中国科学技术大学 2015
[3]基于隐马尔科夫模型的语音合成技术研究[D]. 吴义坚.中国科学技术大学 2006

硕士论文
[1]基于HMM的歌词到歌声转换的研究[D]. 冯欢.西北师范大学 2015
[2]基于参数修改的中文歌声合成算法的研究[D]. 李锦珑.西北师范大学 2011
[3]基于语料库的歌声合成方法[D]. 周树森.哈尔滨工业大学 2008

本文编号：3393359

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3393359.html

上一篇：分层移动信道传输的带宽优化技术仿真
下一篇：基于混合overlay/underlay方式的认知无线电能效优化策略

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|