采用M-矢量和支持向量机的说话人确认系统
【图文】:
后通过MLLR超矢量形成方法从UBM模型自适应得到该说话人的变换矩阵W,把W的所有行按顺序排列起来得到MLLR超矢量.对超矢量进行重叠加窗分割(含重叠元素的均匀分割)就得到一系列的新矢量Mi,这些新矢量就称为M-矢量[3],该过程如图1所示,图中黑色方块表示MLLR超矢量的每一维.其中重叠分割的目的是为了能充分挖掘不同特征维度空间中潜在的能反映说话人身份特性的信息,可类比特征提取过程中对原始语音信号进行重叠加窗分帧的做法.图1M-矢量的结构2.2多类MLLRM-矢量估计与M-矢量的产生不同,本文中多类MLLRM-矢量是在UBM子空间基础上进行MLLR自适应而获得.在此借鉴了传统音素类MLLR自适应技术的优点,采用多个子空间来描述语音信号中含有的丰富细节信息.如从不同的UBM子空间中估计出的M-矢量可从不同语义层面、信道类型、说话人习惯用语等方面对说话人的原始语音进行细节描述.其估计流程如下.·64·华中科技大学学报(自然科学版)第42卷
象减轻,无须估计大量的HMM参数.2.3说话人确认系统构建SVM作为一种直接以最小化分类错误为目标函数的分类器,在说话人确认这种两类分类问题中优势明显,但因说话人识别中目标说话人的训练语料非常少的特殊性而使得SVM的潜能尚未充分得到发挥,如在文献[9]中,每位目标说话人的正例样本点就只有一个GMM均值超向量.本研究提出一种全新的基于支持向量机的说话人确认系统,它将多类MLLRM-矢量作为SVM的输入特征进行模型的训练和测试,其模型训练流程如图2所示,具体步骤如下:步骤1将UBM通过EM算法聚类成S个子空间;步骤2冒认者和目标说话人的每一句原始语音分别通过MLLR算法在各子空间中进行自适应,构建每句话在每个子空间中对应的M-矢量,得到对应于各子空间的M-矢量集合;图2基于多类MLLRM-矢量的支持向量机说话人确认系统训练流程步骤3将M-矢量作为SVM的输入特征并在其核空间中进行信道补偿及相应的说话人模型训练,用以消除跨信道的问题,从而得到最终每位目标说话人的SVM模型.在测试阶段,对于每一段原始语音,同样经过上述三个步骤在SVM核空间中进行信道补偿与测试,得到用于最终判决的SVM得分.这里提出的说话人确认系统由于采用了基于UBM子空间的多类M-矢量,即每位目标说话人的训练正例样本数为子空间数S乘以每个子空间对应的M-矢量数目N,从而使得目标说话人的正例样本数大大增加,能很好地解决训练数据的稀疏问题,在更大程度上挖掘出SVM强大的分类能力.须要提出的是:SVM
【相似文献】
相关期刊论文 前10条
1 何昕,刘重庆,李介谷;基于支撑向量机的说话人确认系统[J];计算机工程与应用;2000年12期
2 邓浩江,王守觉,杜利民;优先度排序RBF神经网络在与文本无关说话人确认中的应用[J];电子与信息学报;2003年09期
3 忻栋,杨莹春,吴朝晖;基于SVM-HMM混合模型的说话人确认[J];计算机辅助设计与图形学学报;2002年11期
4 殷启新,杨鉴;基于高斯混合模型和假设检验方法的说话人确认[J];计算机应用;2004年S1期
5 李轶,范影乐;基于倒谱与复杂性的说话人确认系统[J];杭州电子工业学院学报;2004年06期
6 郭武;戴礼荣;王仁华;;基于均值超矢量聚类和特征映射的说话人确认[J];数据采集与处理;2009年01期
7 张怡颖,朱小燕,张钹;一种新的说话人确认方法[J];软件学报;1999年04期
8 马静;侯丽敏;王朔中;;基于全局背景模型和竞争者模型的说话人确认系统[J];声学技术;2007年01期
9 陈皓,付中华,赵荣椿;说话人确认中针对语音编码差异的似然比得分补偿方法[J];西北工业大学学报;2005年04期
10 石如亮;王波;李弼程;高新建;;低速率信道环境下鲁棒的说话人确认[J];计算机应用;2007年04期
相关会议论文 前10条
1 张涛;王岚;迟惠生;;基于VQ的说话人确认系统的硬件实现[A];第六届全国人机语音通讯学术会议论文集[C];2001年
2 赵亚丽;付中华;谢磊;张健;张艳宁;;双麦克风语音增强和杂混模型训练相结合的顽健说话人确认[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
3 陈胜;徐明星;;基于Feature Warping和ICA的发音方式鲁棒的说话人确认[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
4 杨艺敏;景新幸;杨海燕;;PSO-SVM在说话人确认系统中的研究[A];泛在信息社会中的声学——中国声学学会2010年全国会员代表大会暨学术会议论文集[C];2010年
5 展领;景新幸;;矢量量化和VQ-UBM在说话人确认中的应用[A];中国声学学会2009年青年学术会议[CYCA’09]论文集[C];2009年
6 陈龙;吴志勇;袁春;蒙美玲;蔡莲红;;面向数字版权管理的声纹辅助认证系统[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
7 吴玺宏;迟惠生;;一种高性能的限定文本说话人确认系统[A];第三届全国人机语音通讯学术会议论文集[C];1994年
8 鲍福良;方志刚;徐洁;;基于MFCC和GMM的说话人确认研究[A];第六届全国信息获取与处理学术会议论文集(2)[C];2008年
9 彭诗雅;;声纹识别技术研究[A];第十六届全国青年通信学术会议论文集(上)[C];2011年
10 洪青阳;陈毅东;;一种用于说话人确认的区别性训练方法[A];第八届全国人机语音通讯学术会议论文集[C];2005年
相关重要报纸文章 前4条
1 北京大学信息科学中心视觉与听觉信息处理国家重点实验室 吴玺宏;声纹识别听声辨人[N];计算机世界;2001年
2 实习生 沈春梅;鉴定萨达姆录音真假[N];科技日报;2003年
3 吴玺宏;声纹识别应用前景[N];计算机世界;2001年
4 ;解密声纹锁 一声令下,“芝麻开门”[N];广东科技报;2011年
相关博士学位论文 前10条
1 刘明辉;基于GMM和SVM的文本无关的说话人确认方法研究[D];中国科学技术大学;2007年
2 陆伟;基于缺失特征的文本无关说话人识别鲁棒性研究[D];中国科学技术大学;2008年
3 许东星;基于GMM和高层信息特征的文本无关说话人识别研究[D];中国科学技术大学;2009年
4 解焱陆;基于特征变换和分类的文本无关电话语音说话人识别研究[D];中国科学技术大学;2007年
5 姚志强;说话人识别中提高GMM性能方法的研究[D];中国科学技术大学;2006年
6 李冬冬;基于拓展和聚类的情感鲁棒说话人识别研究[D];浙江大学;2008年
7 龙艳花;基于SVM的话者确认关键技术研究[D];中国科学技术大学;2011年
8 蒋晔;基于短语音和信道变化的说话人识别研究[D];南京理工大学;2013年
9 郭武;复杂信道下的说话人识别[D];中国科学技术大学;2007年
10 高二中;对话电话语音的话者确认研究[D];中国科学技术大学;2011年
相关硕士学位论文 前10条
1 花城;说话人确认的特征域补偿方法研究[D];中国科学技术大学;2014年
2 尹聪;基于感知对数面积比系数的说话人确认系统的研究[D];太原理工大学;2013年
3 周毓;基于因子分析的说话人确认[D];中国科学技术大学;2010年
4 骆启帆;基于声门信息的说话人确认方法研究[D];杭州电子科技大学;2014年
5 李成;基于SoPC技术的便携式说话人确认系统研究与实现[D];北京交通大学;2010年
6 余巍;基于排序GMM的说话人确认的研究[D];中国科学技术大学;2011年
7 李轶;说话人识别系统研究[D];浙江大学;2003年
8 哈斯塔木嘎;嵌入式Linux环境下与文本有关的说话人确认系统实现[D];内蒙古大学;2009年
9 周昆湘;基于矢量量化的与文本无关的说话人确认系统的研究[D];中南大学;2007年
10 赵靖;基于高斯混合模型的说话人确认鲁棒性研究和系统实现[D];重庆大学;2008年
,本文编号:2570105
本文链接:https://www.wllwen.com/kejilunwen/wltx/2570105.html