语音接口在汉语学习寓教于乐系统中的应用
本文选题:语音识别 + 语音评测 ; 参考:《北京交通大学》2009年硕士论文
【摘要】: 近些年来,随着中国经济的快速发展和中国国际地位的不断提高,中国与世界的交往和联系日趋广泛和深入。汉语是中华文化的主要载体,也是世界各国了解中国的重要工具,不少国家出现了学习汉语的热潮。但是在全球汉语学习迅速升温的同时也带来了一些问题,如汉语教学资源不足和传统教学方式不能有效地激发学生学习汉语的兴趣等。而寓教于乐的学习形式能够很好地解决这些问题。自2004年在美国首先提出了这个概念后,它已经在众多领域取得了丰硕的成果,但目前只有少数的研究者致力于外国汉语学习者的寓教于乐教学研究。 针对现在对外汉语教学中出现的问题,我们提出了一种基于语音接口的汉语学习寓教于乐系统,以方便学生自我学习并提高汉语学习的兴趣。本论文的主要工作如下: (1)利用HTK平台建立了一个非特定人孤立词语音识别系统,并从混合高斯模型、语言模型和基频参数等方面对该系统进行改进,最终把系统的识别率提高到98%以上,基本满足了实际的使用要求。 (2)改进了HTK的识别器HVITE,使它能够输出字词和声韵母两个层次的识别结果信息和发音评测结果,为寓教于乐系统的语音接口做好后台处理准备。 (3)提出了一种新的基于HMM的对数似然值与声韵母层时长信息相结合的发音评测方法。本评分方法对专家评分的相关度高于基于HMM的后验概率的方法。通过求解非线性回归模型和模型参数优化,建立两个统一的声韵母对数似然值的映射模型;并将最终的评分及映射模型嵌入HTK的识别器HVITE中。 (4)利用Virtools软件平台,设计并实现汉语发音练习的寓教于乐系统。本系统主要包括建立虚拟现实场景和各个角色模型及其相关的动作,并且将实验室三维重建的成果成功的应用到系统中;利用Virtools中的SDK开发包,在VC++6.0平台上开发适用于本系统的语音识别与评测接口,使本系统实现纠正学生声韵母层汉语发音的功能。
[Abstract]:In recent years, with the rapid development of China's economy and the continuous improvement of China's international status, China's contacts and contacts with the world are increasingly extensive and in-depth. Chinese is not only the main carrier of Chinese culture, but also an important tool for all countries to understand China. However, with the rapid increase of global Chinese learning, some problems have been brought, such as the shortage of Chinese teaching resources and the inability of traditional teaching methods to stimulate students' interest in learning Chinese effectively. And the form of learning with pleasure can solve these problems very well. Since it was first proposed in the United States in 2004, it has achieved fruitful results in many fields, but at present only a few researchers are devoted to the teaching and learning of foreign Chinese learners. In view of the problems in teaching Chinese as a foreign language, we propose a Chinese learning system based on phonetic interface, which can facilitate students' self-learning and improve their interest in learning Chinese. The main work of this thesis is as follows: 1) using HTK platform, a speech recognition system for isolated words is established, and the system is improved from the aspects of mixed Gao Si model, language model and fundamental frequency parameters. Finally, the recognition rate of the system is increased to more than 98%. Basically met the actual use requirements. (2) the HTK recognizer HVITE is improved to output the recognition result information and pronunciation evaluation result at the two levels of word and vowel, so as to prepare the background processing for the phonetic interface of the teaching music system. A new pronunciation evaluation method based on HMM is proposed. The relevance of this method to expert score is higher than that of posterior probability method based on HMM. By solving nonlinear regression model and model parameter optimization, two unified mapping models of logarithmic likelihood value of rhyme and mother are established, and the final score and mapping model are embedded in the recognizer HVITE of HTK. Using Virtools software platform, we design and implement the Chinese pronunciation practice system. The system mainly includes the establishment of virtual reality scene and each role model and its related actions, and the successful application of the results of 3D reconstruction in the laboratory to the system, and the use of SDK development kit in Virtools. The interface of speech recognition and evaluation is developed on the platform of VC 6.0, which makes the system realize the function of correcting students' phonetic master level Chinese pronunciation.
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2009
【分类号】:TN912.34
【相似文献】
相关期刊论文 前10条
1 邢绍邦;韩晓新;赵宏为;;语音识别无线风扇控制器[J];工业控制计算机;2011年08期
2 余姗姗;张亚琼;;语音识别的自适应研究[J];福建电脑;2011年06期
3 胡文静;张国云;唐剑锋;;基于SPCE061A语音识别门禁系统实现的研究[J];计算技术与自动化;2011年02期
4 姜莹;俞一彪;;采用特征分类直方图均衡化的鲁棒性语音识别[J];信号处理;2011年06期
5 努尔比亚·吐拉甫;;维汉在线翻译网站语音语料库的运用[J];华章;2011年18期
6 许斌;;语音识别与云计算技术在全媒体制播业务中的实践探索[J];现代电视技术;2011年07期
7 王帛;冯新喜;余侃民;朱必浩;;一种基于倒谱均值减的语音端点检测改进方法[J];电光与控制;2011年07期
8 徐莉;王志刚;高玺广;张博;;GPRS在智能家居监控系统中的应用[J];电子设计工程;2011年16期
9 郭們;;征服WIN7[J];八小时以外;2011年09期
10 袁铨;张建中;姜衔;周珊珊;曹跃;;动态3维场景中多角色动画的交互式模拟研究[J];中国图象图形学报;2011年06期
相关会议论文 前10条
1 计天颖;王作英;陆大金;;有限命令集连续语音识别[A];第三届全国人机语音通讯学术会议论文集[C];1994年
2 余鹏;王作英;;语音识别码本状态间的线性和非线性相关性[A];第六届全国人机语音通讯学术会议论文集[C];2001年
3 宋君;葛余博;;应用于鲁棒语音识别的置信度加权特征丢失法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
4 靳慧龙;;基于DSP的电视语音拨号遥控技术[A];中国自动化学会、中国仪器仪表学会2004年西南三省一市自动化与仪器仪表学术年会论文集[C];2004年
5 张超;刘轶;郑方;;面向多口音语音识别的声学模型重构[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
6 张超;刘轶;郑方;;面向多口音语音识别的声学模型重构方法[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
7 马晓川;刘冬;赵荣椿;;孤立短语隐马尔可夫模型自动建模软件的实现[A];第四届全国人机语音通讯学术会议论文集[C];1996年
8 郭晨;;汉语语音技术[A];第一届学生计算语言学研讨会论文集[C];2002年
9 赵海滨;王宏;闻绍飞;;嵌入式语音识别控制机械手的系统设计[A];第二届全国信息获取与处理学术会议论文集[C];2004年
10 刘秉权;张凯;王晓龙;;语音识别中基于规则的语言模型的研究[A];第五届全国人机语音通讯学术会议论文集[C];1998年
相关重要报纸文章 前10条
1 乐天;语音识别:让你的手机更聪明[N];计算机世界;2011年
2 本报记者 贾丽;科大讯飞募资4.45亿开拓语音识别业务[N];证券日报;2011年
3 本报记者 俞悦;语音识别质量最重要[N];中国计算机报;2011年
4 ;未来十年展望之体验技术[N];中国计算机报;2010年
5 本报记者 操秀英;颜永红:“搜索”语音识别的未来[N];科技日报;2010年
6 刘权;OSR提升语音识别率[N];中国计算机报;2004年
7 特约作者 王佳彬;语音识别渐入佳境[N];电脑报;2002年
8 本报记者 刘海峰;言丰科技:开拓语音识别的第二空间[N];计算机世界;2000年
9 刘喜喜;语音识别将把鼠标键盘打入冷宫?[N];中国计算机报;2008年
10 ;爱可信与模识科技携手推动语音识别技术应用[N];人民邮电;2006年
相关博士学位论文 前10条
1 刘纪平;多重演化神经网络在语音识别中的应用[D];武汉大学;2011年
2 孙颖;情感语音识别与合成的研究[D];太原理工大学;2011年
3 李伟;基于内容的汉语语音检索技术研究与系统实现[D];清华大学;2011年
4 吕钊;噪声环境下的语音识别算法研究[D];安徽大学;2011年
5 奉小慧;音频噪声环境下唇动信息在语音识别中的应用技术研究[D];华南理工大学;2010年
6 丁沛;语音识别中的抗噪声技术[D];清华大学;2003年
7 刘庆升;计算机辅助普通话发音评测关键技术研究[D];中国科学技术大学;2010年
8 田斌;实用化汉语语音识别理论及关键技术研究[D];西安电子科技大学;1999年
9 陈伟;语音识别声学建模中的主动学习研究[D];北京邮电大学;2011年
10 陈立伟;基于HMM和ANN的汉语语音识别[D];哈尔滨工程大学;2005年
相关硕士学位论文 前10条
1 王,
本文编号:1785379
本文链接:https://www.wllwen.com/jiaoyulunwen/duiwaihanyulunwen/1785379.html