基于WaveNet结构的普通话歌声合成的研究
发布时间:2021-09-11 16:47
歌声,是通过人类嗓音所表达的音乐形式,也是人类语音最富有表现力的表达方式。歌声合成(Singing Voice Synthesis,SVS)是指利用语音合成相关技术,让计算机能够像人一样发出优美动听的歌声。歌声合成作为语音合成技术一个新的应用领域,在虚拟歌手、唱片制作、数字音乐创作等领域都有相当大的应用价值和前景。随着近年来研究者对语音合成技术研究的深入,对歌声合成方法的研究也有了一定进展,但还没有针对普通话歌声合成方法进行深入的研究。由于歌声合成比单纯的语音合成更侧重于对旋律的演绎,而且增加了关于歌曲信息的处理过程,比如节奏、调性等信息,因此歌声合成比语音合成具有更大的挑战性。本文研究了基于统计参数模型的歌声合成算法,在现有普通话语音合成和歌声合成的基础上,提出了一种改良的基于WaveNet结构的普通话歌声合成模型,能够用小的训练语料获得较好的歌声合成效果。本文的主要工作和创新如下:1.建立了一个面向普通话歌声合成的歌声语料库。根据歌曲的节奏、调性等特点,选择了90首歌曲的音乐可扩展标记语言(Music Extensible Markup Language,MusicXML)格式乐谱...
【文章来源】:西北师范大学甘肃省
【文章页数】:51 页
【学位级别】:硕士
【部分图文】:
歌声合成示意图
歌声语料标注样例
乐谱分析流程图
【参考文献】:
期刊论文
[1]面向汉语统计参数语音合成的标注生成方法[J]. 郝东亮,杨鸿武,张策,张帅,郭立钊,杨静波. 计算机工程与应用. 2016(19)
博士论文
[1]基于神经网络的统计参数语音合成方法研究[D]. 胡亚军.中国科学技术大学 2018
[2]基于统计模型的汉语歌声合成研究[D]. 李贤.中国科学技术大学 2015
[3]基于隐马尔科夫模型的语音合成技术研究[D]. 吴义坚.中国科学技术大学 2006
硕士论文
[1]基于HMM的歌词到歌声转换的研究[D]. 冯欢.西北师范大学 2015
[2]基于参数修改的中文歌声合成算法的研究[D]. 李锦珑.西北师范大学 2011
[3]基于语料库的歌声合成方法[D]. 周树森.哈尔滨工业大学 2008
本文编号:3393359
【文章来源】:西北师范大学甘肃省
【文章页数】:51 页
【学位级别】:硕士
【部分图文】:
歌声合成示意图
歌声语料标注样例
乐谱分析流程图
【参考文献】:
期刊论文
[1]面向汉语统计参数语音合成的标注生成方法[J]. 郝东亮,杨鸿武,张策,张帅,郭立钊,杨静波. 计算机工程与应用. 2016(19)
博士论文
[1]基于神经网络的统计参数语音合成方法研究[D]. 胡亚军.中国科学技术大学 2018
[2]基于统计模型的汉语歌声合成研究[D]. 李贤.中国科学技术大学 2015
[3]基于隐马尔科夫模型的语音合成技术研究[D]. 吴义坚.中国科学技术大学 2006
硕士论文
[1]基于HMM的歌词到歌声转换的研究[D]. 冯欢.西北师范大学 2015
[2]基于参数修改的中文歌声合成算法的研究[D]. 李锦珑.西北师范大学 2011
[3]基于语料库的歌声合成方法[D]. 周树森.哈尔滨工业大学 2008
本文编号:3393359
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3393359.html