基于Fisher比的梅尔倒谱系数混合特征提取方法
本文选题:识别精度 + 梅尔倒谱系数 ; 参考:《计算机应用》2014年02期
【摘要】:针对语音识别中梅尔倒谱系数(MFCC)对中高频信号的识别精度不高,并且没有考虑各维特征参数对识别结果影响的问题,提出基于MFCC、逆梅尔倒谱系数(IMFCC)和中频梅尔倒谱系数(MidMFCC),并结合Fisher准则的特征提取方法。首先对语音信号提取MFCC、IMFCC和MidMFCC三种特征参数,分别计算三种特征参数中各维分量的Fisher比,通过Fisher比对三种特征参数进行选择,组成一种混合特征参数,提高语音中高频信息的识别精度。实验结果表明,在相同环境下,新的特征与MFCC参数相比,识别率有一定程度的提高。
[Abstract]:In view of the low accuracy of Mel cepstrum coefficient MFCC in speech recognition and the fact that the influence of each dimension characteristic parameter on the recognition result is not considered. A method of feature extraction based on MFCC, inverse Mel cepstrum coefficient (IMFCCC) and if Mel cepstrum coefficient (MIDMFCC) is proposed, which is combined with Fisher criterion. Firstly, the speech signal is extracted from the three characteristic parameters of MFCC / IMFCC and MidMFCC, and the Fisher ratio of each dimension component of the three feature parameters is calculated, and the three characteristic parameters are selected by Fisher comparison to form a mixed feature parameter. Improve the recognition accuracy of high frequency information in speech. The experimental results show that the recognition rate of the new feature is higher than that of the MFCC parameter in the same environment.
【作者单位】: 重庆大学自动化学院;
【分类号】:TN912.34
【参考文献】
中国期刊全文数据库 前7条
1 甄斌,吴玺宏,刘志敏,迟惠生;语音识别和说话人识别中各倒谱分量的相对重要性[J];北京大学学报(自然科学版);2001年03期
2 韩一;王国胤;杨勇;;基于MFCC的语音情感识别[J];重庆邮电大学学报(自然科学版);2008年05期
3 袁正午;肖旺辉;;改进的混合MFCC语音识别算法研究[J];计算机工程与应用;2009年33期
4 张芸;李昕;郑宇;杨庆涛;;一种基于Fisher准则的说话人识别方法研究[J];兰州大学学报(自然科学版);2007年02期
5 胡峰松;张璇;;基于梅尔频率倒谱系数与翻转梅尔频率倒谱系数的说话人识别方法[J];计算机应用;2012年09期
6 魏艳;张雪英;;噪声条件下的语音特征PLP参数的提取[J];太原理工大学学报;2009年03期
7 尹辉;谢湘;匡镜明;;基于听觉模型与自适应分数阶Fourier变换的声学特征在语音识别中的应用[J];声学学报;2012年01期
【共引文献】
中国期刊全文数据库 前10条
1 马志友,杨莹春,吴朝晖;二次特征提取及其在说话人识别中的应用[J];电路与系统学报;2003年02期
2 雷鹏;工厂自动控制系统的说话人识别模块实现[J];电声技术;2002年10期
3 徐海华,何玉明;LBG算法中空包腔的优化处理[J];电声技术;2004年03期
4 王书诏;邱天爽;;与文本无关的说话人识别系统的设计[J];电声技术;2006年12期
5 王书诏;邱天爽;;说话人识别研究综述[J];电声技术;2007年01期
6 张伟伟;杨鼎才;;用于说话人识别的MFCC的改进算法[J];电子测量技术;2009年08期
7 应武;;基于元音MFCC的说话人识别系统研究[J];电子测量与仪器学报;2007年03期
8 张鹏;马伟敏;唐棣芳;;基于ARM的嵌入式VoIP终端的设计与实现[J];电子技术;2008年02期
9 白莹;赵振东;戚银城;王斌;郭建勇;;基于小波神经网络的与文本无关说话人识别方法研究[J];电子与信息学报;2006年06期
10 王钟斐;王彪;;基于MATLAB的皮肤听声器系统的研究[J];电子设计工程;2011年08期
中国重要会议论文全文数据库 前10条
1 许鑫;苏开娜;胡起秀;;几种改进的MFCC特征提取方法在说话人识别中的应用[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
2 李桂春;郑能恒;李霞;;基于模糊隶属值加权的MFCC特征提取算法[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【poster】[C];2011年
3 高原;景新幸;;基于线性与非线性特征组合的说话人识别系统研究[A];2006年声频工程学术交流会论文集[C];2006年
4 任华娟;景新幸;;用于说话人识别的FWMC特征参数提取[A];中国声学学会2009年青年学术会议[CYCA’09]论文集[C];2009年
5 袁冬梅;俞一彪;颜祥;戴志强;;非线性频谱变换的说话人识别性能分析[A];2006’和谐开发中国西部声学学术交流会论文集[C];2006年
6 田岚;侯正信;陆小珊;;基于多元信息和GMM的序贯判决话者识别[A];2008通信理论与技术新发展——第十三届全国青年通信学术会议论文集(下)[C];2008年
7 鲍福良;方志刚;徐洁;;基于MFCC和GMM的说话人确认研究[A];第六届全国信息获取与处理学术会议论文集(2)[C];2008年
8 周翠梅;陈U,
本文编号:1947886
本文链接:https://www.wllwen.com/kejilunwen/wltx/1947886.html