当前位置:主页 > 科技论文 > 网络通信论文 >

耳语音检测技术研究

发布时间:2020-03-19 18:06
【摘要】:在生物学的定义中,会说话和能够借助工具是人和其他动物最本质的差别。语言也是自人类诞生以来所依赖的重要的交流工具,语言具有自然且方便,简洁且明了,准确且高效等优点。语音是语言的外在表示方式,能够最直观的体现我们的思维活动,语音由人的发音器官产生,承载着非常丰富的信息,是人们思想表达和情感交互的重要方式。在人们探索语言追本溯源的过程中逐渐形成了语音学,语音学是语言学的分支之一,它旨在探索人类的语言声音,本文所讨论的耳语是语音学的分支之一。耳语发音模式的语音被叫做耳语音(whisper),又称之为悄悄话,是日常生活中最普遍的信息交互形式之一。对比正常的发音方式,耳语的发音模式较为独特,当用耳语发声时发声器官不会产生振动,而是一种特殊的摩擦激励发声模式。近代由于通信设施和科技手段的不断完善和发展,耳语的应用也更加的广泛,从最开始的理论研究发展到当下的实际应用。正因为耳语发音的独特性,使用耳语音的交流方式可以在很好的保护个人隐私的情况下,同时保证不会干扰到其他人的正常活动~([1]),所以研究耳语音具有重要的研究意义。本文围绕耳语音检测技术展开讨论,耳语音端点检测是耳语音识别的预处理部分,它非常大的影响了耳语音识别系统的精确度,本文针对耳语音在静音和在噪声背景下分别使用能零比(Energy to Zero Ratio,EZCR)和经验模式分解(Emperial Mode Decomposition,EMD)的方法实现了耳语的端点检测。本文作者通过观察语音时域和频域的基本特征提出了三种具有优良区分性的基本声学特征音高、音强和共振峰;通过对上述特征的分析,提出元音的可能存在方式具有两种,一种是正常音中的振动形式,第二种是耳语音中的无振动的存在形式。并利用三种特征借助机器学习分类算法和高斯混合模型(Gaussian Mixture Model,GMM)统计学分类算法来区分正常语音和耳语音两种语音声效模式,比较了8种分类算法的分类性能,得到K近邻的分类算法分类性能最优的结论。同时编译了离线训练的耳语音检测网页展示软件。研究了不同的时长段3s,4s,5s,6s,混合时长的语音对检测结果准确度的影响,并且得到不同时长的语音段对于耳语音和正常语音的分类结果基本上没有影响的结论。最后,分别利用百度API和HTK(Hidden Markov Model Toolkit)工具箱实现了特定品质语音的识别和耳语音孤立词的识别工作。
【图文】:

示意图,示意图,原动力,海绵组织


图 3.1 发音示意图[8]Figure 3.1 Pronunciation sketch map[8]肺是胸腔内的一团有弹性的海绵组织,具有储存空气的功能,在肺部受到膈膜挤压排出形成原动力。气管作为通道将气流运输到咽喉部位。喉部位于气管的上方位置,由四块

状态图,声门,状态,声母


图 3.2 声门四种状态[3]Figure 3.2 Four state graph of the glottis[3]音最小的单元,中文发音的音节是由元音和其前后依靠的辅音组素叫做声母,声母的后半部分才是元音[2]。自然发声时,声母部发音的时候声带则没有阻碍,,而是声带相对靠拢,形成窄缝声门
【学位授予单位】:内蒙古大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TN912.3

【参考文献】

相关期刊论文 前10条

1 晁浩;宋成;彭维平;;语音识别中声效模式的分析及检测[J];计算机应用研究;2015年08期

2 郑美容;;基于HTML5的Web应用研究[J];工业控制计算机;2014年12期

3 潘欣裕;赵鹤鸣;;中文耳语元音的声调特征研究[J];信号处理;2011年10期

4 徐坤玉;张彩珍;药雪崧;;语音信号的加窗傅里叶变换研究[J];山西师范大学学报(自然科学版);2011年03期

5 谈雪丹;顾济华;赵鹤鸣;陶智;韩韬;吴俊;;基于HHT瞬时能频值的耳语音端点检测[J];计算机工程与应用;2010年29期

6 韩立华;王博;段淑凤;;语音端点检测技术研究进展[J];计算机应用研究;2010年04期

7 金峗;赵艳;黄程韦;赵力;;耳语音情感数据库的设计与建立[J];声学技术;2010年01期

8 陈雪勤;赵鹤鸣;;基于听觉模型的汉语耳语音声调检测[J];电子学报;2009年04期

9 赵艳;赵力;邹采荣;;耳语音的语音处理研究综述[J];声学技术;2008年04期

10 茹婷婷;谢湘;;耳语音数据库的设计与采集[J];清华大学学报(自然科学版);2008年S1期

相关博士学位论文 前2条

1 龚呈卉;基于联合因子分析的耳语音说话人识别研究[D];苏州大学;2014年

2 范昕炜;支持向量机算法的研究及其应用[D];浙江大学;2003年

相关硕士学位论文 前1条

1 丁爱明;基于MFCC和GMM的说话人识别系统研究[D];河海大学;2006年



本文编号:2590519

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/2590519.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e2494***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com