基于MCE准则的语音识别特征线性判别分析
本文选题:线性判别分析 + 语音识别 ; 参考:《自动化学报》2014年06期
【摘要】:提出了一种基于最小分类错误(Minimum classification error,MCE)准则的线性判别分析方法(Linear discriminant analysis,LDA),并将其应用到连续语音识别中的特征变换.该方法采用非参数核密度估计方法进行数据概率分布估计;根据得到的概率分布,在最小分类错误准则下,采用基于梯度下降的线性搜索算法求解判别分析变换矩阵.利用判别分析变换矩阵对相邻帧梅尔滤波器组输出拼接的超矢量变换降维,得到时频特征.实验结果表明,与传统的MFCC特征相比,经过本文判别分析提取的时频特征其识别准确率提高了1.41%,相比于HLDA(Heteroscedastic LDA)和近似成对经验正确率准则(Approximate pairwise empirical accuracy criterion,aPEAC)判别分析方法,识别准确率分别提高了1.14%和0.83%.
[Abstract]:In this paper, a linear discriminant analysis method based on minimum classification error minimum classification error classification criterion is proposed and applied to feature transformation in continuous speech recognition. The nonparametric kernel density estimation method is used to estimate the probability distribution of the data and the linear search algorithm based on gradient descent is used to solve the discriminant analysis transformation matrix under the minimum classification error criterion according to the obtained probability distribution. Using the discriminant analysis transform matrix to reduce the dimension of the output splicing of adjacent frame Mel filter banks, the time-frequency features are obtained. The experimental results show that, compared with the traditional MFCC features, the recognition accuracy of the time-frequency features extracted by the discriminant analysis in this paper is improved by 1.41th, compared with the HLDA(Heteroscedastic LDAs and the approximate empirical accuracy criterion, the approximate pairwise empirical accuracy criteria of the discriminant analysis. The recognition accuracy increased by 1.14% and 0.83% respectively.
【作者单位】: 解放军信息工程大学信息系统工程学院;
【基金】:国家自然科学基金(61175017)资助~~
【分类号】:TN912.34
【参考文献】
相关期刊论文 前1条
1 王骏;王士同;邓赵红;应文豪;;面向小目标图像的快速核密度估计图像阈值分割算法[J];自动化学报;2012年10期
【共引文献】
相关期刊论文 前2条
1 赵晓;侯晴宇;梁冰冰;张伟;;基于多属性融合的高分辨率遥感图像云检测方法[J];光学技术;2014年02期
2 柯登峰;徐波;;互联网时代语音识别基本问题[J];中国科学:信息科学;2013年12期
相关博士学位论文 前1条
1 应文豪;基于Parzen Window估计的分类与聚类方法及应用研究[D];江南大学;2013年
相关硕士学位论文 前2条
1 辛晚霞;基于KFCM聚类与GMP追踪算法的图像分割与修复技术研究[D];中北大学;2014年
2 陈志刚;基于度量学习和聚类的一致性预测器算法研究[D];厦门大学;2014年
【二级参考文献】
相关期刊论文 前1条
1 陶文兵;金海;;一种新的基于图谱理论的图像阈值分割方法[J];计算机学报;2007年01期
相关博士学位论文 前1条
1 李佐勇;基于统计和谱图的图像阈值分割方法研究[D];南京理工大学;2010年
【相似文献】
相关期刊论文 前10条
1 余华;徐开军;;基于模糊集理论的语音情感识别[J];信息化研究;2011年02期
2 芮瑞;鲍长春;;噪声环境下的窄带音频信号快速分类方法[J];计算机工程与应用;2011年16期
3 赵海滨;刘冲;李春胜;王宏;;采用频带能量进行ECoG信号的特征提取[J];东北大学学报(自然科学版);2010年10期
4 谢达东,吴及,王作英;线性判别分析在汉语语音识别中的应用[J];计算机工程与应用;2002年23期
5 刘传武;毕笃彦;张智军;;基于AdaBoost的雷达目标HRRP识别[J];数据采集与处理;2008年05期
6 姚斯强;胡剑凌;;线性判别分析和支持向量机的音乐分类方法[J];电声技术;2006年12期
7 毛鹏;杨鼎才;;一种对混合说话人特征提取的新方法[J];计算机系统应用;2009年05期
8 张志华,王炳锡,彭煊;一种基于线性判别分析的稳健话音检测方法[J];电声技术;2005年05期
9 徐洁;杨鼎才;;基于线性判别分析的语音特征提取新方法[J];无线电工程;2005年12期
10 王宏;赵海滨;刘冲;;采用小波熵和频带能量提取脑电信号特征[J];吉林大学学报(工学版);2011年03期
相关博士学位论文 前5条
1 张宇;基于视觉诱发电位的脑—机接口分析算法优化及实时控制系统构建[D];华东理工大学;2013年
2 柴晶;雷达高分辨距离像目标识别的拒判算法和特征提取技术研究[D];西安电子科技大学;2010年
3 邓志安;基于学习算法的WLAN室内定位技术研究[D];哈尔滨工业大学;2012年
4 吴杰;基于高分辨距离像的雷达自动目标识别技术研究[D];南京航空航天大学;2012年
5 高翔;浅埋地层探地雷达信号处理与目标识别研究[D];中国海洋大学;2011年
相关硕士学位论文 前10条
1 胡备;脑电特征提取与在线脑机接口研究[D];燕山大学;2012年
2 王佳毅;噪音环境下说话人识别方法[D];上海交通大学;2009年
3 张仲明;基于高分辨一维距离像的雷达目标识别方法研究[D];国防科学技术大学;2004年
4 卢英;基于表面肌电信号的下肢动作识别研究[D];武汉理工大学;2013年
5 薛绍龙;运动想象脑电信号处理技术研究[D];哈尔滨工程大学;2013年
6 马静;空间目标特征提取及识别技术[D];西安电子科技大学;2010年
7 郑芳;基于脑电信号的KNN及Na(?)ve Bayes分类器在OPTIMI系统中的研究[D];兰州大学;2012年
8 苏振江;基于高分辨一维距离像的雷达目标识别研究[D];电子科技大学;2010年
9 周丽娜;基于脑磁图的脑机接口方法研究[D];燕山大学;2011年
10 黄山奇;鲁棒语言辨识关键技术研究[D];解放军信息工程大学;2011年
,本文编号:1813561
本文链接:https://www.wllwen.com/kejilunwen/wltx/1813561.html