当前位置:主页 > 科技论文 > 信息工程论文 >

基于模糊综合评价的语音评测模型的研究与实现

发布时间:2018-01-15 13:04

  本文关键词:基于模糊综合评价的语音评测模型的研究与实现 出处:《东华理工大学》2017年硕士论文 论文类型:学位论文


  更多相关文章: 语音评测 模糊综合评价 云平台


【摘要】:随着移动互联网的迅速发展,语音评测技术已经成为当前国内外口语学习领域的研究热点,目前主要应用于教育行业中的口语考试评测和口语辅助教学当中。在外语学习过程中,口语学习一直是众多外语学习者的软肋,因此如何有效的利用语音评测技术解决外语口语不达标的问题成为当前研究的重点和难点。本文针对目前英语学习中口语评测问题,在分析了英语发音特点以及语音韵律特征的基础上,提出了基于模糊综合评价的语音评测模型,同时将该方法进行移植并实现了基于Android平台的语音评测系统。主要工作内容如下:首先建立基于云平台下的标准语音评测库。采用英国和美国国家语料库作为标准语音库。通过线上收集的方法抓取网页上英语语音文件并分类保存到云平台上,以及通过线下收集方法对英语单词进行分类后收集了10个人(不同性别)读300个单元音的4种情况(正常、升调、降调、错读)、300个双元音、600个多元音的7种情况(正常、快读、慢读、升调、降调、部分错、全部错)总共75000个语音文件数据作为语音训练库,由10位英语专家根据发音情况进行评测并建立专家评测库,通过Android平台的语音上传模块以及语音评测模块不断扩充云平台的语音测试库。其次在分析英语发音中音高、音长和轻重音等发音特点的基础上提取语音的韵律特征信息(梅尔频率倒谱系数特征、基频特征和短时能量特征),利用层次分析法计算出各特征参数对语音评测结果的权重值,采用动态时间规则算法对标准语音和测试语音进行相似度比对,同时提出了基于模糊综合评价的语音评测模型并给出最后语音评测结果。通过Matlab仿真实验对改进的语音评测模型进行详细的性能分析以及实验对比,实验显示该改进模型有很强的高效性和实用性。最后将改进的语音评测模型移植到Android平台上,设计并实现了基于云平台的语音评测系统,通过实验人员对系统进行评测效果测试,测试结果基本可以满足语音评测系统要求。
[Abstract]:With the rapid development of mobile Internet, voice evaluation technology has become a hot topic in the field of oral English learning at home and abroad. At present, it is mainly used in the evaluation of oral examination and oral assistant teaching in education industry. In the process of foreign language learning, oral learning has always been the weakness of many foreign language learners. Therefore, how to effectively use the phonetic evaluation technology to solve the problem of oral English substandard has become the focus and difficulty of current research. This paper aims at the problem of oral evaluation in English learning. Based on the analysis of English pronunciation and phonetic prosody, a speech evaluation model based on fuzzy comprehensive evaluation is proposed. At the same time, the method is transplanted and the voice evaluation system based on Android platform is realized. The main work is as follows:. Firstly, the standard voice evaluation database based on cloud platform is established. The national corpus of the United Kingdom and the United States is used as the standard voice database. The English voice files on the web page are captured and stored on the cloud platform by the method of online collection. After classifying English words offline, 10 people (of different genders) were collected in 4 situations (normal, ascending, descending, misreading, 300 divowels). A total of 75000 voice file data as a voice training library for 7 cases of 600 polyvowels (normal, fast, slow, ascending, down, partially wrong, all wrong). According to the pronunciation of 10 English experts to evaluate and establish an expert evaluation database. Through the voice upload module of Android platform and the voice evaluation module, the voice test library of cloud platform is expanded. Secondly, the analysis of the high pitch of English pronunciation is made. The prosodic feature information (Mel frequency cepstrum coefficient feature, fundamental frequency feature and short time energy feature) is extracted based on the phonetic characteristics such as length and light and heavy tone. AHP is used to calculate the weight of each characteristic parameter to the result of speech evaluation, and the dynamic time rule algorithm is used to compare the similarity between the standard speech and the tested speech. At the same time, the speech evaluation model based on fuzzy comprehensive evaluation is proposed and the final speech evaluation results are given. The improved speech evaluation model is analyzed and compared in detail by Matlab simulation experiment. Experiments show that the improved model has high efficiency and practicability. Finally, the improved voice evaluation model is transplanted to Android platform, and a voice evaluation system based on cloud platform is designed and implemented. The test results can meet the requirements of the speech evaluation system.
【学位授予单位】:东华理工大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TN912.3

【相似文献】

相关期刊论文 前10条

1 杜守富,詹永照;说话人语音改变技术研究与实现[J];计算机工程;2004年12期

2 谢贵武;杨继红;肖勇;闵刚;;基于语音分段的自适应时长调整算法[J];军事通信技术;2008年02期

3 樊建中;孙晴;杨永杰;;一种智能盲文学习机设计[J];现代电子技术;2010年05期

4 温洪昌;黄应强;傅贵兴;;单片机的多段语音组合录放系统设计[J];单片机与嵌入式系统应用;2011年10期

5 张剑;袁华强;;Rhetorical-State SVM在抽取式语音摘要中的应用[J];科学技术与工程;2013年21期

6 卢坚 ,毛兵 ,孙正兴 ,张福炎;一种改进的基于说话者的语音分割算法[J];软件学报;2002年02期

7 章文义,朱杰;几种无语音检测噪音估计方法的比较研究[J];计算机工程与设计;2003年10期

8 林鑫;陈桦;王开志;王继成;;语音驱动唇形自动合成算法[J];计算机工程;2007年17期

9 蔡铁;;基于在线单类支持向量机的自适应语音活动检测[J];深圳信息职业技术学院学报;2008年02期

10 章钊;郭武;;话者识别中结合模型和能量的语音激活检测算法[J];小型微型计算机系统;2010年09期

相关会议论文 前9条

1 田野;王作英;陆大金;;基于韵律结构信息的非语音拒识[A];第六届全国人机语音通讯学术会议论文集[C];2001年

2 徐明;胡瑞敏;黄云森;;基于音素识别的语音评价方法[A];第二届和谐人机环境联合学术会议(HHME2006)——第15届中国多媒体学术会议(NCMT'06)论文集[C];2006年

3 王欢良;韩纪庆;李海峰;王承发;;面向嵌入式应用的小词汇量语音串识别系统[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年

4 那斯尔江·吐尔逊;吾守尔·斯拉木;麦麦提艾力;;维吾尔语大词汇量连续语音识别研究——语音语料库的建立[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年

5 简志华;王向文;;考虑帧间信息的语音转换算法[A];浙江省信号处理学会2012学术年会论文集[C];2012年

6 魏维;马海燕;;一种丢失语音信包重建的新算法[A];通信理论与信号处理新进展——2005年通信理论与信号处理年会论文集[C];2005年

7 陈凡;罗四维;;一个实用语音开发应用系统的设计与实现[A];第二届全国人机语音通讯学术会议论文集[C];1992年

8 刘红星;戴蓓劏;陆伟;;基于图像增强方法的共振峰谐波能量参数的语音和端点检测[A];第九届全国人机语音通讯学术会议论文集[C];2007年

9 林爱华;张文俊;王毅敏;;基于肌肉模型的语音驱动唇形动画[A];第十三届全国图象图形学学术会议论文集[C];2006年

相关重要报纸文章 前5条

1 atvoc;数码语音电路产品概述[N];电子资讯时报;2008年

2 记者 李山;德用双音素改进人工语音表达[N];科技日报;2012年

3 中国科学院自动化研究所模式识别国家重点实验室 于剑邋陶建华;个性化语音生成技术面面观[N];计算机世界;2007年

4 江西 林慧勇;语音合成芯片MSM6295及其应用[N];电子报;2006年

5 ;与“小超人”对话[N];中国计算机报;2001年

相关博士学位论文 前10条

1 高伟勋;智能家居环境中个性化语音生成关键技术研究[D];东华大学;2015年

2 陈丽萍;说话人确认中语音段差异建模相关问题的研究[D];中国科学技术大学;2016年

3 朱铮宇;语音唇动关联性分析方法研究及其在录音回放检测中的应用[D];华南理工大学;2016年

4 陶冶;文本语音匹配的研究和应用[D];山东大学;2009年

5 何俊;声纹身份识别中非常态语音应对方法研究[D];华南理工大学;2012年

6 李冬冬;基于拓展和聚类的情感鲁棒说话人识别研究[D];浙江大学;2008年

7 双志伟;个性化语音生成研究[D];中国科学技术大学;2011年

8 古今;语音感知认证的关键技术研究[D];中国科学技术大学;2009年

9 彭波;Internet上语音的鲁棒性传输研究[D];华南理工大学;2001年

10 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年

相关硕士学位论文 前10条

1 王明明;基于GMM和码本映射相结合的语音转换方法研究[D];西安建筑科技大学;2015年

2 印雪晨;宋词朗读呼吸信号和韵律时长研究[D];西北民族大学;2015年

3 邱一良;噪声环境下的语音检测方法研究[D];电子科技大学;2015年

4 朱俊梅;基于性别预分类的年龄自动估计研究[D];江苏师范大学;2014年

5 张占松;基于DSP的语音干扰方法研究与实现[D];北京交通大学;2016年

6 李鹏;基于系统融合的语音查询项检索技术研究[D];解放军信息工程大学;2015年

7 赵蓉蓉;基于计算听觉场景分析的单通道语音盲分离技术[D];太原理工大学;2016年

8 崔瑞莲;语种识别中的语音段表示方法研究[D];中国科学技术大学;2016年

9 刘学;基于语音样例查询的关键词识别方法研究[D];中国科学技术大学;2016年

10 王振文;汉藏双语跨语言语音转换方法的研究[D];西北师范大学;2015年



本文编号:1428452

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1428452.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ccae5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com