唇读研究进展综述
[Abstract]:Some researchers have paid attention to the method of combining computer lip reading technology with speech recognition technology to improve the effect of speech recognition, and have made great progress, but there are still many difficult problems that need to be broken through. In order to arouse more researchers' interest and concern in this field, to participate in the research of lip reading technology, and to promote the development of this field, the present situation of lip reading technology is introduced in detail. This paper summarizes some main traditional methods and some new technologies in related fields, mainly focusing on visual feature extraction, recognition technology and information fusion algorithm of audio and video.
【作者单位】: 北华大学信息技术与传媒学院;吉林大学计算机科学与技术学院;
【基金】:国家科技支撑计划子课题基金项目(2011BAK07B03-9)
【分类号】:TN912.34
【参考文献】
相关期刊论文 前1条
1 徐彦君,杜利民,李国强,张欣,周治;汉语听觉视觉双模态数据库CAVSR1.0[J];声学学报;2000年01期
【共引文献】
相关期刊论文 前10条
1 周治,杜利民,徐彦君;汉语听觉视觉双模态信息的互补作用[J];中国科学E辑:技术科学;2000年03期
2 陈妍玲;肖惜;;PETS-3口语测试评分方法对信度的影响[J];金华职业技术学院学报;2011年04期
3 何元烈,应自炉,张有为;用K-D树实现对双模态多媒体数据库的有效查询[J];计算机工程与应用;2003年18期
4 洪晓鹏,姚鸿勋,徐铭辉;基于句子级的唇读语料库及其切分算法[J];计算机工程与应用;2005年03期
5 赵晖;林成龙;唐朝京;;基于视频三音子的双模态语料自动选取算法[J];计算机工程;2009年17期
6 奉小慧;;基于改进的level set嘴唇轮廓定位方法[J];计算机应用;2009年01期
7 严乐贫;奉小慧;;双模态车载语音控制仿真系统的设计与实现[J];计算机与现代化;2010年08期
8 项军平;;浅谈PETS-3口语测试评分方法[J];科技信息(科学教研);2007年16期
9 单卫,姚鸿勋,高文;唇读中序列口型的分类[J];中文信息学报;2002年01期
10 赵晖;林成龙;唐朝京;;基于视频三音子的汉语双模态语料库的建立[J];中文信息学报;2009年05期
相关会议论文 前2条
1 张燕;王海啸;;视觉法和听觉法对中国学生英语语调训练效果的比较[A];第九届中国语音学学术会议论文集[C];2010年
2 单卫;姚鸿勋;高文;;唇读中序列口型的分类[A];第六届全国人机语音通讯学术会议论文集[C];2001年
相关博士学位论文 前5条
1 奉小慧;音频噪声环境下唇动信息在语音识别中的应用技术研究[D];华南理工大学;2010年
2 梁亚玲;基于单视觉通道唇读系统的研究[D];华南理工大学;2011年
3 王蒙军;唇读发声器中视觉信息的检测与处理[D];天津大学;2007年
4 赵晖;真实感汉语可视语音合成关键技术研究[D];国防科学技术大学;2010年
5 张泽梁;唇读识别中若干问题的研究[D];吉林大学;2012年
相关硕士学位论文 前10条
1 李新;唇读识别系统的研究与实现[D];华北电力大学(北京);2011年
2 姚文娟;基于视频的唇部定位和序列切分算法的研究[D];华南理工大学;2011年
3 杨帆;基于动静态多源特征选取、对齐与融合的唇读方法[D];哈尔滨工业大学;2010年
4 陶宏;基于视频图像的唇读识别技术的研究[D];江苏大学;2005年
5 王晓钟;基于内唇特征提取的唇语识别[D];广东工业大学;2008年
6 于涛;唇型提取及识别的图像处理算法研究[D];内蒙古大学;2008年
7 万玉奇;提高唇读理解的关键技术研究[D];哈尔滨工业大学;2007年
8 赵燕燕;基于视频图像的唇部检测与跟踪方法研究[D];长春理工大学;2009年
9 张盛平;唇读中的特征提取、选择与融合[D];哈尔滨工业大学;2008年
10 严乐贫;音视频双模态车载语音控制系统的设计与实现[D];华南理工大学;2010年
【二级参考文献】
相关期刊论文 前1条
1 张家,
本文编号:2312052
本文链接:https://www.wllwen.com/kejilunwen/wltx/2312052.html