基于深度神经网络的语音驱动发音器官的运动合成

发布时间：2017-11-16 20:22

本文关键词：基于深度神经网络的语音驱动发音器官的运动合成

【摘要】：实现一种基于深度神经网络的语音驱动发音器官运动合成的方法,并应用于语音驱动虚拟说话人动画合成.通过深度神经网络(Deep neural networks,DNN)学习声学特征与发音器官位置信息之间的映射关系,系统根据输入的语音数据估计发音器官的运动轨迹,并将其体现在一个三维虚拟人上面.首先,在一系列参数下对比人工神经网络(Artificial neural network,ANN)和DNN的实验结果,得到最优网络;其次,设置不同上下文声学特征长度并调整隐层单元数,获取最佳长度;最后,选取最优网络结构,由DNN输出的发音器官运动轨迹信息控制发音器官运动合成,实现虚拟人动画.实验证明,本文所实现的动画合成方法高效逼真.
【作者单位】：西南交通大学信息科学与技术学院;
【基金】：成都市科技项目(科技惠民技术研发项目)(2015-HM01-00050-SF) 四川省动漫研究中心2015年度科研项目(DM201504) 西南交通大学2015年研究生创新实验实践项目(YC201504109)资助~~
【分类号】：TN912.3;TP183
【正文快照】： 由于视觉与听觉是人类最主要、最便捷的两种沟通方式,因此虚拟人动画结合听视觉双模态沟通方式的特点,将虚拟人的视觉信息作为其声音的一种补充.例如,额外的舌头和唇部等发音器官的运动,眉毛和眼睑等面部特征,甚至是头部和肢体的动作等,这些附加信息可以极大提高虚拟人动画的

【相似文献】

中国期刊全文数据库前3条

1 ;好声音,从何而来?[J];科技传播;2012年19期

2 傅怀平,张学国,杨红;多路合成全息语音发音器官图谱的研究[J];光电子·激光;2002年12期

3 ;[J];;年期

中国重要报纸全文数据库前7条

1 王若愚;惜言如金能护嗓[N];保健时报;2006年

2 齐建荣;儿童口吃与心理有关[N];大众卫生报;2007年

3 衣晓峰本报记者姚艳春;别让嗓子“超负荷”[N];黑龙江日报;2004年

4 红火;人到年老应护嗓[N];中国中医药报;2006年

5 记者谢苗枫　通讯员卢健民彭梅蕾;暨大明年新增播音专业[N];南方日报;2008年

6 柳军;帮助孩子正确发音[N];大众卫生报;2000年

7 本报记者　聂翠蓉;我是机器,我像人[N];科技日报;2006年

中国硕士学位论文全文数据库前1条

1 宋婵;人体发音过程中的三维声道几何建模[D];天津大学;2014年

，

本文编号：1193595

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1193595.html

上一篇：高增益高隔离度毫米波MIMO天线
下一篇：泰安电信光网络演进的研究与实施

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|