基于深度神经网络的语音驱动发音器官的运动合成
发布时间:2017-11-16 20:22
本文关键词:基于深度神经网络的语音驱动发音器官的运动合成
更多相关文章: 深度神经网络 语音驱动 运动合成 虚拟说话人
【摘要】:实现一种基于深度神经网络的语音驱动发音器官运动合成的方法,并应用于语音驱动虚拟说话人动画合成.通过深度神经网络(Deep neural networks,DNN)学习声学特征与发音器官位置信息之间的映射关系,系统根据输入的语音数据估计发音器官的运动轨迹,并将其体现在一个三维虚拟人上面.首先,在一系列参数下对比人工神经网络(Artificial neural network,ANN)和DNN的实验结果,得到最优网络;其次,设置不同上下文声学特征长度并调整隐层单元数,获取最佳长度;最后,选取最优网络结构,由DNN输出的发音器官运动轨迹信息控制发音器官运动合成,实现虚拟人动画.实验证明,本文所实现的动画合成方法高效逼真.
【作者单位】: 西南交通大学信息科学与技术学院;
【基金】:成都市科技项目(科技惠民技术研发项目)(2015-HM01-00050-SF) 四川省动漫研究中心2015年度科研项目(DM201504) 西南交通大学2015年研究生创新实验实践项目(YC201504109)资助~~
【分类号】:TN912.3;TP183
【正文快照】: 由于视觉与听觉是人类最主要、最便捷的两种沟通方式,因此虚拟人动画结合听视觉双模态沟通方式的特点,将虚拟人的视觉信息作为其声音的一种补充.例如,额外的舌头和唇部等发音器官的运动,眉毛和眼睑等面部特征,甚至是头部和肢体的动作等,这些附加信息可以极大提高虚拟人动画的
【相似文献】
中国期刊全文数据库 前3条
1 ;好声音,从何而来?[J];科技传播;2012年19期
2 傅怀平,张学国,杨红;多路合成全息语音发音器官图谱的研究[J];光电子·激光;2002年12期
3 ;[J];;年期
中国重要报纸全文数据库 前7条
1 王若愚;惜言如金能护嗓[N];保健时报;2006年
2 齐建荣;儿童口吃与心理有关[N];大众卫生报;2007年
3 衣晓峰 本报记者 姚艳春;别让嗓子“超负荷”[N];黑龙江日报;2004年
4 红 火;人到年老应护嗓[N];中国中医药报;2006年
5 记者 谢苗枫 通讯员 卢健民 彭梅蕾;暨大明年新增播音专业[N];南方日报;2008年
6 柳军;帮助孩子正确发音[N];大众卫生报;2000年
7 本报记者 聂翠蓉;我是机器,我像人[N];科技日报;2006年
中国硕士学位论文全文数据库 前1条
1 宋婵;人体发音过程中的三维声道几何建模[D];天津大学;2014年
,本文编号:1193595
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1193595.html