当前位置:主页 > 文艺论文 > 动漫艺术论文 >

基于语音驱动的人脸口型动画系统

发布时间:2018-05-18 03:11

  本文选题:三维人脸建模 + 语音识别 ; 参考:《吉林大学》2012年硕士论文


【摘要】:近年来,随着信息产业的重要性日益突出,,计算机技术得到了突飞猛进的发展,带动了计算机软硬件的升级,计算机动画产业也随之逐渐兴起。在当今动漫产业发展的黄金时期,计算机图形学与数字媒体技术得到了广泛地应用和发展。本文意在实现利用语音对三维人脸模型进行驱动以产生动画效果,从此角度出发,逐步引出实现人脸动画的方法,人脸的建模方法,人脸关键点的选取与控制,语音特征参数的提取,MPEG-4标准下人脸动画系统的实现方法以及人脸表情的实现方法等技术。 本文的最终目标是生成平滑流畅的基于MPEG-4标准的由语音进行驱动的人脸口型动画。基于此,首先,需要利用三维建模软件制作出人脸的三维模型,然后导出为.X模型文件,再利用OpenGL技术将模型导入三维环境的窗口中并显示出来,通过纹理映射技术将人脸纹理贴图映射到三维人脸网格模型上,可以得到较真实的三维人脸模型。然后,利用Baum-Welch算法训练样本以形成语音特征参数与人脸动画参数之间的映射关系,这是人脸动画系统实现过程中的关键一步,其将为下面将要展开的工作奠定基础。接下来,对输入语音文件进行处理,提取出其语音特征参数,并将其与此前建立起来的语音特征参数与人脸动画参数映射库进行比对,从库中提取出与语音特征参数呈映射关系的人脸动画参数信息以便利用它来对人脸网格模型进行驱动。最后,利用MPEG-4标准中提供的算法,通过查找人脸定义表FDT中的相关信息计算出人脸模型上各控制点的新位置坐标,从而可以使得人脸模型产生动作,进而得到语音与人脸口型相同步的动画效果。在此基础上,本文又进一步阐述了人脸表情的实现和应用。
[Abstract]:In recent years, with the importance of the information industry becoming more and more prominent, computer technology has been developed by leaps and bounds, which has led to the upgrading of computer hardware and software, and the computer animation industry has gradually risen. In the golden age of animation industry, computer graphics and digital media technology have been widely used and developed. The purpose of this paper is to use speech to drive 3D face model to produce animation effect. From this point of view, the method of realizing face animation, the method of human face modeling, the selection and control of key points of human face are introduced step by step. The extraction of speech feature parameters and the implementation of face animation system based on MPEG-4 standard, and the realization method of facial expression, etc. The final goal of this paper is to generate smooth and smooth facial mouth animation driven by speech based on MPEG-4 standard. Based on this, we need to use 3D modeling software to make 3D model of human face, then export it as. X model file, then use OpenGL technology to import the model into the window of 3D environment and display it. Based on the texture mapping technique, a more realistic 3D face model can be obtained by mapping the texture map to the 3D face mesh model. Then, the Baum-Welch algorithm is used to train the samples to form the mapping relationship between the speech feature parameters and the face animation parameters, which is a key step in the implementation of the face animation system, which will lay the foundation for the work to be carried out below. Then, the input speech file is processed, its speech feature parameters are extracted, and compared with the previously established mapping library of speech feature parameters and facial animation parameters. The facial animation parameters which are mapped to the speech feature parameters are extracted from the database to drive the face mesh model. Finally, using the algorithm provided in the MPEG-4 standard, the new position coordinates of each control point on the face model can be calculated by looking up the relevant information in the face definition table FDT, which can make the face model produce the action. Then the animation effect of speech synchronizing with facial mouth is obtained. On this basis, the realization and application of facial expression are further discussed.
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP391.41

【参考文献】

相关期刊论文 前9条

1 周东生;张强;魏小鹏;;人脸动画中语音可视化算法研究进展[J];计算机工程与应用;2007年09期

2 张翔宇,华蓓,陈意云;人脸建模和动画的基本技术[J];计算机辅助设计与图形学学报;2001年04期

3 谢金晶;陈益强;刘军发;;基于语音情感识别的多表情人脸动画方法[J];计算机辅助设计与图形学学报;2008年04期

4 高文,金辉;面部表情图像的分析与识别[J];计算机学报;1997年09期

5 陈益强,高文,王兆其,姜大龙;基于机器学习的语音驱动人脸动画方法[J];软件学报;2003年02期

6 张青山,陈国良;具有真实感的三维人脸动画[J];软件学报;2003年03期

7 詹永照,宋顺林,佘江峰,张建明;脸部表情动画建模方法的研究与实现[J];软件学报;1998年02期

8 慕晓萍;张建民;;基于特征点的表情动画方法[J];系统仿真学报;2008年S1期

9 王让定,柴佩琪;一个基于谱熵的语音端点检测改进方法[J];信息与控制;2004年01期

相关硕士学位论文 前10条

1 陈亚勇;基于文字驱动的人脸动画及其人脸模型的快速重建[D];浙江大学;2002年

2 邹自强;基于MPEG-4的人脸建模和人脸动画[D];北京工业大学;2003年

3 徐海华;说话人识别方法及其系统的应用开发研究[D];华中科技大学;2004年

4 李楠;基于MPEG-4标准的三维人脸动画[D];浙江大学;2005年

5 汤玲;基于HMM模型的语音识别系统研究[D];国防科学技术大学;2005年

6 田坤;人脸建模和基于MPEG-4的动画实现[D];北京邮电大学;2006年

7 李治国;一个全自动的基于MPEG-4的三维人脸动画实现方法[D];中国科学院研究生院(计算技术研究所);2002年

8 涂欢;语音和文本联合驱动卡通人脸动画的方法及其面向移动娱乐应用[D];湘潭大学;2007年

9 张思光;韵律文本驱动的三维口型动画研究[D];北京工业大学;2008年

10 刘洁娟;基于MPEG-4的人脸建模和动画实现研究[D];华东师范大学;2008年



本文编号:1904103

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/dongmansheji/1904103.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1badf***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com