当前位置:主页 > 科技论文 > 信息工程论文 >

语音信号端点检测算法的研究

发布时间:2018-04-19 14:36

  本文选题:语音识别 + 语音端点检测 ; 参考:《郑州大学》2016年硕士论文


【摘要】:在当前信息科技时代,语音信号识别(ASR)技术、语音信号编码(ASC)技术、及语音信号增强(ASE)技术[1]将会在安防领域、人机交互领域、通信领域以及未来的消费电子产品领域[2]产生强有力的技术支撑作用。通过语音信号端点检测技术,可以准确地分析出一段语音信号中的纯语音信号和静音段[3],该技术直接对ASR、ASE技术的性能和ASC技术的效率产生决定性影响[4]。可以用三个环节来表征一个完整的语音端点检测模型:首先,语音信号预处理环节,包括信号滤波、语音流分帧以及信号加窗等[5]。其次,提取整个语音流的特征向量,小波分析(WA)技术的多分辨率解析特性是提取语音信号特征向量的极好方法[6]。最后,语音端点判别模型的建立[7]。传统的语音端点检测算法有基于时域的双门限法、基于频域的普熵法以及基于倒普特征的检测方法等。针对在低信噪比和复杂的噪声环境下,为了得到满意的端点检测效果,本文提出了基于优化极限学习机(ELM)的端点检测模型,通过优化网络连接参数以弥补算法本身的不足。(1)为了优化ELM神经网络的输入权值和隐含层偏差,结合粒子群优化(PSO)算法,形成了粒子群优化极限学习机(PSO-ELM)端点检测模型。依靠ELM神经网络的快速学习能力,瞬间完成端点检测并输出预测结果。该算法在一定程度上优化了网络连接结构,但是仍然存在一定的缺陷。(2)为了更好的优化ELM神经网络的连接参数,最后采用自适应步长果蝇(FOAMR)算法优化极限学习机,并将优化后算法应用于语音端点判别模型中。在Matlab辅助软件环境中做了大量的仿真实验,通过实验结果可以得出结论,单纯的ELM模型具有最好的快速性和较高的准确率;PSO-ELM模型的准确率有所提升但是训练时间最长;而最终基于自适应果蝇优化ELM模型具有最高的准确率,同时具备了很好的快速性,达到了实际应用的要求。
[Abstract]:In the age of information technology, the technology of speech signal recognition (ASR), speech signal coding (ASC) and speech signal Enhancement (ASE) will be used in the field of security and human-computer interaction.The communication field and the future consumer electronics field [2] have strong technical support function.The pure speech signal and mute segment in a speech signal can be accurately analyzed by the endpoint detection technique of speech signal. This technique has a decisive effect on the performance of ASR ASE technology and the efficiency of ASC technology [4].A complete speech endpoint detection model can be represented by three links: first, the speech signal preprocessing, including signal filtering, speech stream framing and signal windowing, etc.Secondly, extracting the feature vector of the whole speech stream and the multi-resolution analytical characteristic of the wavelet analysis (WAW) technique is an excellent method to extract the feature vector of the speech signal [6].Finally, the establishment of speech endpoint discriminant model [7].The traditional speech endpoint detection algorithms include dual threshold method based on time domain, general entropy method based on frequency domain and detection method based on inverted features.In order to obtain satisfactory endpoint detection effect in low SNR and complex noise environment, an endpoint detection model based on Elm, an optimized extreme learning machine, is proposed in this paper.In order to optimize the input weights and hidden layer deviations of the ELM neural network and combine the particle swarm optimization (PSO) algorithm, a PSO extreme learning machine (PSO ELM) endpoint detection model is formed by optimizing the network connection parameters to make up the deficiency of the algorithm.Based on the fast learning ability of ELM neural network, the endpoint detection is completed and the prediction results are output.The algorithm optimizes the network connection structure to a certain extent, but there are still some defects. In order to better optimize the connection parameters of ELM neural network, the adaptive step size FOAMR-based algorithm is used to optimize the ultimate learning machine.The optimized algorithm is applied to the speech endpoint discrimination model.A large number of simulation experiments have been done in the environment of Matlab aided software. It can be concluded from the experimental results that the pure ELM model has the best rapidity and higher accuracy. The accuracy of PSO-ELM model has been improved but the training time is the longest.Finally, the ELM model based on adaptive Drosophila optimization has the highest accuracy and rapidity, which meets the requirements of practical application.
【学位授予单位】:郑州大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN912.3

【相似文献】

相关期刊论文 前10条

1 王亚涛,朴春俊,权花紫;强噪音情况下的多种端点检测方法研究[J];信息技术;2005年02期

2 邝航宇,张军,韦岗;一种基于检测元音的孤立词端点检测算法[J];电声技术;2005年03期

3 方杰;李英;钱红;;一种连续词端点检测的改进方法[J];电声技术;2006年08期

4 李晋;王玲;;一种改进的孤立词端点检测方法[J];计算机工程与应用;2006年30期

5 何清波;孔凡让;王建平;刘永斌;;基于独立分量分析特征提取的带噪信号端点检测[J];数据采集与处理;2007年01期

6 董胡;钱盛友;;一种基于小波和时频分解的端点检测方法[J];微计算机信息;2007年30期

7 李亦佳;赵淳;;嵌入式平台的复杂环境下端点检测[J];电脑编程技巧与维护;2008年17期

8 周娜;赵振东;张莹;;背景噪声下的端点检测算法的研究[J];通信技术;2008年07期

9 张亚歌;张太镒;夏川;;噪声评估在端点检测中的应用[J];计算机技术与发展;2010年09期

10 张春雷;曾向阳;王曙光;;基于临界带功率谱方差的端点检测[J];声学技术;2012年02期

相关会议论文 前8条

1 贾川;张健;陈振标;徐波;;噪声环境下的端点检测算法研究[A];第六届全国人机语音通讯学术会议论文集[C];2001年

2 王卓;李鹏;苏牧;徐波;;噪音环境下基于高阶谱的端点检测算法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年

3 王月;屈百达;李金宝;蒋纯刚;;一种改进的基于频带方差的端点检测算法[A];2007中国控制与决策学术年会论文集[C];2007年

4 尹巧萍;吴海宁;赵力;;含噪语音信号端点检测方法的研究[A];2008’促进中西部发展声学学术交流会论文集[C];2008年

5 尹洪兵;秦斌;张凡;黄云森;;一种基于能量-过零率比的端点检测方法[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年

6 国雁萌;潘接林;颜永红;韩疆;张建平;;基于子带能量的自适应端点检测[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年

7 李曼曼;杨鸿武;洪宁;杨硕;刘亚丽;;基于EMD的带噪语音端点检测[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年

8 朱杰;韦晓东;;采用HMM模型方法进行语音信号的端点检测[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年

相关重要报纸文章 前1条

1 中国科学院声学研究所研究员 俞铁城;语音的端点检测和系统的打断功能[N];通信产业报;2005年

相关博士学位论文 前1条

1 周文君;舰船VDR人声识别技术研究[D];哈尔滨工程大学;2009年

相关硕士学位论文 前10条

1 杨喜敬;带噪汉、彝语孤立词的端点检测方法对比研究[D];昆明理工大学;2015年

2 邢立钊;语音信号端点检测算法的研究[D];郑州大学;2016年

3 沈蓉;智能门禁系统声纹识别中端点检测算法研究[D];西安科技大学;2015年

4 石海燕;基于小波变换的汽车语音特征指令逼近与端点检测方法[D];浙江工业大学;2009年

5 刘艳辉;带噪语音信号端点检测算法的研究及实现[D];河南理工大学;2014年

6 马静霞;带噪语音端点检测方法的研究[D];燕山大学;2007年

7 雷文钿;复杂环境下高效端点检测算法研究及应用[D];厦门大学;2014年

8 杨超;背景噪声下的端点检测技术研究[D];华北电力大学(河北);2008年

9 董胡;强噪声环境下语音信号端点检测方法研究[D];湖南师范大学;2008年

10 张徽强;带噪语音信号的端点检测和声韵分离[D];国防科学技术大学;2005年



本文编号:1773498

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1773498.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1f292***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com