当前位置:主页 > 科技论文 > 信息工程论文 >

语音可懂度客观评价策略的研究

发布时间:2018-07-13 14:03
【摘要】:在信息时代背景下,语音是人们日常生活中最直接的信息传递与交换形式。而现实生活中,多数语音往往伴随着噪声,使人感到舒适度下降。听力受损的人理解不同背景噪声下的语音是很困难的。因此,怎样从信号中分离噪声、改善可懂度以及如何评价可懂度成为了一个重要问题。目前,理想二值掩蔽(Ideal Binary Mask, IBM)技术的提出,给噪声背景下评价语音可懂度提供了希望。最近研究表明每个时间-频率单元对语音可懂度重要性与语音内容相关。时间-频率单元被分为噪声主导和目标语音主导两类。本文实验结果表明每个语音存在的时间-频率单元对语音可懂度的重要性与目标语音的响度有关。2008年,Li和Loizou研究证明,当输入信噪比在-5dB下,误报错误比丢失错误对语音可懂度的影响更大。本实验对输入混合信噪比进行了扩充,研究了不同输入混合信噪比下,两种掩蔽错误对语音可懂度的影响。本文实验证明,当混合信噪比在0dB以下时,误报错误比丢失错误对语音可懂度影响更大。理想二值掩蔽的研究大都是基于这样一个假设:每个语音分离单元对语音整体可懂度的贡献度是一样的,但没有改变IBM结构。考虑到两种掩蔽错误对语音可懂度影响程度和IBM结构对语音可懂度的影响,本文提出了对丢失错误和误报错误进行加权控制的方法,同时结合IBM结构的改变,意在提出更好的评价语音可懂度的指标。
[Abstract]:In the background of the information age, speech is the most direct form of information transfer and exchange in people's daily life. In real life, most of the voice often accompanied by noise, making people feel comfortable. It is difficult to understand the sound of the hearing impaired. For this, how to separate the noise from the signal and improve the intelligibility. And how to evaluate intelligibility has become an important problem. At present, the proposed Ideal Binary Mask (IBM) technology provides hope for the evaluation of speech intelligibility under the noise background. Recent studies have shown that the importance of each time frequency unit to the speech intelligibility is related to the speech content. The time frequency unit is divided into noise, and the time frequency unit is divided into noise. The experimental results show that the importance of the time frequency unit on speech intelligibility in each speech is related to the phonetic loudness of the target speech in.2008 years. Li and Loizou studies show that when the input signal-to-noise ratio is in -5dB, the error of false alarm is greater than that of the loss and error on the speech intelligibility. The mixed SNR is expanded to study the effect of two masking errors on speech intelligibility under different input mixed signal to noise ratio. In this paper, it is proved that when the mixed SNR is below 0dB, false alarm error has greater influence on speech intelligibility than loss error. The study of ideal two value masking is based on such a hypothesis. The contribution of a speech separation unit to the overall intelligibility of speech is the same, but it does not change the IBM structure. Considering the effect of the two masking errors on the degree of speech intelligibility and the effect of the IBM structure on the intelligibility of speech, this paper proposes a weighted control method for the loss and misrepresentation errors, and combines the changes of the IBM structure. A better indicator to evaluate the intelligibility of speech.
【学位授予单位】:内蒙古大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN912.3

【相似文献】

相关期刊论文 前10条

1 齐鲁;从流利语言中摘出词句的可懂度——说话速度和词句长度的影响[J];声学学报;1964年02期

2 齐鲁;从对话中摘出词句的可懂度[J];声学学报;1964年02期

3 陈惠德;;%AL_cons的测试[J];电声技术;1989年05期

4 周笃强,黄端生,牛聪敏,陈善广,高慧;快速测量汉语语言可懂度方法的研究[J];航天医学与医学工程;1997年04期

5 马建芬;张雪英;;增强型语音可懂度的评价[J];计算机工程与应用;2012年32期

6 姚峰英,张敏;一种增强带噪语音可懂度的新算法[J];声学学报;2002年06期

7 付建梅;张雪英;曹棣;马建芬;;提取耳蜗熵的语音可懂度评价算法[J];中国科技论文;2013年10期

8 刘鹏;马建芬;;具有较高可懂度的子空间语音增强算法[J];计算机工程与设计;2013年07期

9 朱庆厚;;受周期中断影响的话音可懂度的研究与意义[J];航天电子对抗;1991年02期

10 梁佩璧;许枫;;一种带通滤波后语音可懂度的客观评价方法[J];微计算机应用;2010年06期

相关会议论文 前3条

1 李宁;李蕾;孟子厚;;长治方言词汇的可懂度调查[A];第九届中国语音学学术会议论文集[C];2010年

2 汤朝菊;文森特·范赫恩;;汉语方言互懂度的实验测试[A];中国社会语言学(2006年第2期)[C];2006年

3 许伟;曾新吾;龚昌超;;不同带宽和采样频率语音可懂度的实验研究[A];2008年全国声学学术会议论文集[C];2008年

相关硕士学位论文 前10条

1 叶琪;低信噪比环境下语音可懂度增强算法研究[D];安徽大学;2016年

2 王锡s,

本文编号:2119619


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/2119619.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b4885***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com