语音端点检测方法研究
本文关键词:语音端点检测方法研究 出处:《大连理工大学》2016年硕士论文 论文类型:学位论文
更多相关文章: 端点检测 子带谱方差 HMM FCM 前导静音段
【摘要】:语音端点检测是指在背景噪声存在下,找到一个单词或语音段的起始点和结束点。它在语音识别、语音编码和语音传输等语音信号处理中起着重要作用。一种有效的端点检测方法,不仅能正确标识语音端点,而且能减少数据处理时间、提高效率和节省数据存储空间。本文介绍了语音信号的产生模型和人耳听觉特性,分析了语音分帧和加窗这些预处理过程。简要回顾了常用的端点检测方法,如短时能量和过零率法、谱方差法、MFCC倒谱距离法和谱熵法等。总结了各种常用算法的思想、流程及特点,并给出了各算法所用特征参数曲线图。提出了两种新的端点检测算法:(1)提出了一种改进的自适应子带谱方差端点检测方法。因为不同类型噪声的频率能量集中在不同的频率带上,所以可以通过准确地去掉这些含有太多噪声的频率带,并自适应地选择有用子带能量,来得到更多准确的语音频率谱信息。使语音段方差和噪声段方差之间的区分度变大,端点检测更容易,准确率更高。同时有效减少了需处理的语音数据,提高系统整体性能。并将该算法应用到高斯连续HMM语音识别系统中,实验表明,该算法提高了识别系统准确率及抗噪性。(2)提出了一种无前导静音段语音的端点检测算法。基于阈值的端点检测方法假设语音起始段为无语音的静音段,并根据该无语音的起始段的特征值设置阈值。如果检测的语音帧的特征值大于阈值,就认为该帧是语音帧,否则认为该帧是噪声帧。若该假设不成立,预设的阈值将不可用,最终导致端点检测错误。本文通过FCM聚类方法避开了阈值设置问题。该算法在检测无前导静音段语音时,表现出了很好的性能。
[Abstract]:Speech endpoint detection refers to finding the beginning and ending point of a word or speech segment in the presence of background noise. Speech coding and voice transmission play an important role in speech signal processing. An effective endpoint detection method can not only correctly identify speech endpoints, but also reduce data processing time. This paper introduces the speech signal generation model and auditory characteristics, analyzes the preprocessing process of speech framing and windowing, and briefly reviews the common endpoint detection methods. Such as short-time energy and zero-crossing rate method, spectral variance method, MFCC cepstrum distance method and spectral entropy method, etc. The ideas, flow chart and characteristics of various commonly used algorithms are summarized. The graph of characteristic parameters used in each algorithm is given, and two new endpoint detection algorithms: 1) are proposed. An improved adaptive subband spectrum variance endpoint detection method is proposed because the frequency energy of different types of noise is concentrated on different frequency bands. So it is possible to remove the frequency bands which contain too much noise accurately and to select the useful sub-band energy adaptively. In order to get more accurate speech frequency spectrum information, the distinction between the variance of speech segment and the variance of noise segment becomes larger, the endpoint detection is easier and the accuracy is higher. At the same time, the speech data that needs to be processed is reduced effectively. The algorithm is applied to Gao Si continuous HMM speech recognition system. This algorithm improves the accuracy and anti-noiseness of the recognition system. (2) an endpoint detection algorithm for speech without leading mute segment is proposed. The threshold based endpoint detection method assumes that the beginning segment of speech is a voiceless mute segment. If the eigenvalue of the detected speech frame is greater than the threshold value, the frame is considered to be a speech frame, otherwise the frame is considered to be a noisy frame. The preset threshold will not be available, resulting in endpoint detection errors. In this paper, the threshold setting problem is avoided by FCM clustering method. The algorithm shows good performance in detecting speech without leading mute segment.
【学位授予单位】:大连理工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN912.3
【相似文献】
相关期刊论文 前10条
1 陈凤翥;;基于熵的语音端点检测方法探讨[J];技术与市场;2008年09期
2 雷鸣;李学仁;李果;;飞机舱音背景声下的鲁棒语音端点检测[J];振动与冲击;2008年10期
3 韩立华;王博;段淑凤;;语音端点检测技术研究进展[J];计算机应用研究;2010年04期
4 果永振,何遵文;一种多特征语音端点检测算法及实现[J];通信技术;2003年01期
5 刘鹏,王作英;多模式语音端点检测[J];清华大学学报(自然科学版);2005年07期
6 刘晓明,覃胜,刘宗行,江泽佳;语音端点检测的仿真研究[J];系统仿真学报;2005年08期
7 茹海峰,殷业;基于与图像相结合的语音端点检测方法研究[J];仪器仪表学报;2005年S1期
8 张岳;韩子丹;戴志强;;普通话孤立词语音端点检测的分形维方法研究[J];中国传媒大学学报(自然科学版);2006年01期
9 赵高峰;张雪英;侯雪梅;;一种基于小波系数方差的语音端点检测方法[J];太原理工大学学报;2006年05期
10 沈亚强;;低信噪比下基于短时分形维数的语音端点检测[J];仪器仪表学报;2006年S3期
相关会议论文 前10条
1 王明;刘好新;张歆奕;;一种基于时频方差和的语音端点检测方法研究[A];教育部中南地区高等学校电子电气基础课教学研究会第二十届学术年会会议论文集(下册)[C];2010年
2 杨雅婷;马博;王磊;吐尔洪·吾司曼;李晓;;基于声频特征的维吾尔语语音端点检测方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
3 李军;张兆宁;王旭芳;;一种强噪声背景下的语音端点检测方法[A];全国第二届信号处理与应用学术会议专刊[C];2008年
4 茹海峰;殷业;;基于与图像相结合的语音端点检测方法研究[A];第三届全国信息获取与处理学术会议论文集[C];2005年
5 张晓雷;吴及;吕萍;;基于支持向量机与多观测复合特征矢量的语音端点检测[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
6 张晓雷;吴及;吕萍;;基于支持向量机与多观测复合特征矢量的语音端点检测[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
7 刘婕;高鸿斌;王洁;;噪声环境下基于关联维的语音端点检测(英文)[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
8 李建民;方棣棠;;语音端点检测中门限阈值的自动确定及音节切割的新判据[A];第一届全国语言识别学术报告与展示会论文集[C];1990年
9 蒋纯纲;屈百达;李金宝;王月;;基于小波变换后的分形理论的语音端点检测[A];2007中国控制与决策学术年会论文集[C];2007年
10 国雅萌;付强;;复杂噪声环境中的语音端点检测[A];第八届全国人机语音通讯学术会议论文集[C];2005年
相关硕士学位论文 前10条
1 王海旭;基于卷积神经网络的语音端点检测方法研究[D];内蒙古大学;2015年
2 张松轶;语音端点检测技术及在应急通信中的应用[D];西安电子科技大学;2009年
3 熊威;复杂噪声环境下语音端点的检测算法的研究[D];东华大学;2016年
4 李乐;语音端点检测算法的研究及应用[D];西安建筑科技大学;2016年
5 张超;语音端点检测方法研究[D];大连理工大学;2016年
6 刘洋;基于神经网络的语音端点检测方法研究[D];大连理工大学;2010年
7 赵丽霞;噪声环境下基于特征的语音端点检测研究[D];湖南大学;2010年
8 夏敏磊;语音端点检测技术研究[D];浙江大学;2005年
9 赵高峰;基于小波分析的语音端点检测算法研究[D];太原理工大学;2006年
10 乔峰;基于信息熵和神经网络的语音端点检测算法研究[D];太原理工大学;2007年
,本文编号:1403527
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1403527.html