语音识别中基于低秩约束的本征音子说话人自适应方法
本文关键词: 语音识别 说话人自适应 本征音子 低秩约束 近点梯度法 出处:《电子与信息学报》2014年04期 论文类型:期刊论文
【摘要】:该文提出一种基于低秩约束的本征音子(Eigenphone)说话人自适应方法。原始的本征音子说话人自适应方法在自适应语料充分时具有很好的效果,然而当自适应语料不足时,出现严重的过拟合现象,导致自适应后的系统可能比自适应前的系统还要差。首先,对协方差矩阵为对角阵的隐马尔可夫-高斯混合模型语音识别系统,推导出一种简化的本征音子矩阵估计算法;然后,对本征音子矩阵引入低秩约束,采用矩阵的核范数作为矩阵秩的凸近似,通过调节核范数的权重因子以有效控制自适应模型的复杂度;最后,给出一种加速近点梯度算法以求解新算法中引入的带有核范数正则项的数学优化问题。汉语连续语音识别的说话人自适应实验表明,引入低秩约束后,本征音子说话人自适应方法的自适应效果得到了明显提高,在5~50 s的自适应数据条件下,均取得了比最大似然线性回归后接最大后验(MLLR+MAP)自适应更佳的识别效果。
[Abstract]:In this paper, a low rank constraint based Eigenphone-based speaker adaptation method is proposed. The original Eigenphone-based approach has a good effect when the adaptive corpus is sufficient, but when the adaptive corpus is insufficient, the original method has a good effect. Because of the serious over-fitting phenomenon, the adaptive system may be worse than the pre-adaptive system. Firstly, for the speech recognition system with diagonal matrix of covariance matrix, hidden Markov Gaussian mixture model can be used for speech recognition. A simplified eigentone submatrix estimation algorithm is derived, and then the low rank constraint is introduced to the eigenphonon matrix, and the kernel norm of the matrix is used as the convex approximation of the matrix rank. The complexity of the adaptive model is effectively controlled by adjusting the weight factor of the kernel norm. Finally, In this paper, an accelerated near-point gradient algorithm is proposed to solve the mathematical optimization problem with kernel norm canonical terms introduced in the new algorithm. The speaker adaptive experiment of Chinese continuous speech recognition shows that, when low rank constraint is introduced, The adaptive effect of the intrinsic speaker adaptive method is improved obviously. Under the condition of 550s of adaptive data, the adaptive performance is better than that of MLLR map adaptation after maximum likelihood linear regression.
【作者单位】: 解放军信息工程大学信息系统工程学院;
【基金】:国家自然科学基金(61175017) 国家863计划项目(2012AA011603)资助课题
【分类号】:TN912.34
【参考文献】
相关期刊论文 前1条
1 张文林;牛铜;张连海;李弼程;;基于最大似然可变子空间的快速说话人自适应方法[J];电子与信息学报;2012年03期
【共引文献】
相关期刊论文 前10条
1 秦晓燕;袁广林;;基于主分量寻踪与分析的炮弹炸点检测[J];兵工学报;2013年10期
2 王卓峥;贾克斌;刘帷;;基于稀疏表示与矩阵填充的多帧超分辨率图像重建[J];北京工业大学学报;2014年01期
3 黄晓生;黄萍;曹义亲;严浩;;一种基于PCP的块稀疏RPCA运动目标检测算法[J];华东交通大学学报;2013年05期
4 彭淑娟;柳欣;崔振;郑光;;分段式低秩逼近的运动捕获数据去噪方法[J];计算机科学;2013年09期
5 刘芳;武娇;杨淑媛;焦李成;;结构化压缩感知研究进展[J];自动化学报;2013年12期
6 薛倩;杨程屹;王化祥;;去除椒盐噪声的交替方向法[J];自动化学报;2013年12期
7 WEN ShouWen;XU FangFang;WEN ZaiWen;LIN Chen;;Robust linear optimization under matrix completion[J];Science China(Mathematics);2014年04期
8 齐耀辉;潘复平;葛凤培;颜永红;;鉴别性最大后验概率声学模型自适应[J];计算机应用;2014年01期
9 李轶南;贾冲;杨吉斌;吴海佳;张立伟;;稀疏低秩模型下的单通道自学习语音增强算法[J];数据采集与处理;2014年02期
10 袁珍;林相波;王新宁;;滤除图像中混合噪声的LSE模型[J];信号处理;2013年10期
相关博士学位论文 前9条
1 刘丽敏;选择性聚类融合算法研究[D];中南大学;2013年
2 王卓峥;高性能图像超分辨率方法的研究[D];北京工业大学;2013年
3 刘光灿;基于机器学习的物体识别[D];上海交通大学;2013年
4 王聪;网络空间嵌入模型与应用研究[D];电子科技大学;2013年
5 李丹;几类非光滑优化的交替线性化算法[D];大连理工大学;2013年
6 梁锡军;稀疏优化在机器学习中的若干应用[D];大连理工大学;2013年
7 林颖;全向视觉传感器标定[D];浙江大学;2013年
8 陈斌;异常检测方法及其关键技术研究[D];南京航空航天大学;2013年
9 谢志鹏;压缩感知的稀疏重构算法研究[D];南京航空航天大学;2012年
相关硕士学位论文 前5条
1 谈元鹏;基于压缩感知理论的图像识别与图像流恢复方法研究[D];中国计量学院;2013年
2 齐娜;图像信号的二维稀疏表示模型的研究[D];北京工业大学;2013年
3 葛广重;基于稀疏表示的单幅图像超分辨率重建研究[D];南京邮电大学;2013年
4 武国梁;基于双摄像机的多视点立体成像系统[D];天津大学;2012年
5 赵峰;基于鉴别投影和回归分类的人脸识别方法研究[D];南京理工大学;2014年
【二级参考文献】
相关期刊论文 前1条
1 李虎生,刘加,刘润生;语音识别说话人自适应研究现状及发展趋势[J];电子学报;2003年01期
【相似文献】
相关期刊论文 前10条
1 单翼翔,张昊天,李虎生,钟林,张进,刘加,刘润生;邮包校核语音识别系统的实时实现[J];电子学报;2002年04期
2 苏腾荣;吴及;王作英;;基于空间相关性变换的声学模型训练[J];电子与信息学报;2010年04期
3 蔡瑞昌;;未来的电话[J];电子技术;1980年08期
4 赵鹤芹;;一个适用于孤立单词语音识别系统的数据压缩方法—WHT算法[J];云南工业大学学报;1990年03期
5 马天蔚;;让语音超越桌面[J];每周电脑报;1999年32期
6 ;文字/语音识别系统[J];中国电子商情;2001年01期
7 刘云冰;;语音识别技术的回顾与展望[J];软件导刊;2005年13期
8 刘福才;王冬云;;语音识别技术及其在控制领域中的应用研究(一)[J];可编程控制器与工厂自动化;2005年11期
9 王宏;郭艳丽;贾新民;;基于HMM的孤立字识别[J];昌吉学院学报;2006年01期
10 贺无名;;语音识别技术及其研究进展[J];中国科技信息;2006年18期
相关会议论文 前10条
1 胡春静;吴善培;;不定人的语音识别系统[A];第三届全国人机语音通讯学术会议论文集[C];1994年
2 牛小川;徐波;;说话人自适应策略与方法的研究与实验[A];第五届全国人机语音通讯学术会议论文集[C];1998年
3 杨学增;方棣棠;;神经网络用于语音识别初探[A];第一届全国语言识别学术报告与展示会论文集[C];1990年
4 王作英;;非齐次语音识别HMM模型和THED语音识别与理解系统[A];第二届全国人机语音通讯学术会议论文集[C];1992年
5 王承发;赵德彬;金山;苗百利;朱志莹;;语音识别应用中抗噪声干扰方法的初步探讨[A];第二届全国人机语音通讯学术会议论文集[C];1992年
6 董林;袁保宗;周继成;;一种基于神经网络的汉语语音识别方法[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
7 国立新;莫福源;李昌立;;基于分段K平均训练的汉语全音节语音识别的研究[A];第三届全国人机语音通讯学术会议论文集[C];1994年
8 王昆仑;樊志锦;吐尔洪江;方晓华;徐绍琼;吾买尔;;维吾尔语综合语音数据库系统[A];第五届全国人机语音通讯学术会议论文集[C];1998年
9 崔毓菁;刘刚;;基于HMM的语音识别系统中状态输出概率计算优化算法的研究[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
10 王承发;肖毅壮;韩纪庆;;一种语音识别系统的端点检测算法[A];第二届全国人机语音通讯学术会议论文集[C];1992年
相关重要报纸文章 前10条
1 ;e-t@lk语音识别系统亮相中国[N];国际商报;2000年
2 平远;多语种交谈式语音识别系统[N];北京电子报;2000年
3 北京清华大学电子工程系副教授 刘加 教授 刘润生;让机器听懂我的话[N];科技日报;2001年
4 ;听声音识别嫌疑犯[N];检察日报;2002年
5 ;终结键盘时代[N];中国计算机报;2001年
6 本报记者 刘学习;认准语音识别的“内核”[N];计算机世界;2002年
7 本报记者 陈丹;人与机器的“对话”[N];科技日报;2010年
8 特约作者 王佳彬;语音识别渐入佳境[N];电脑报;2002年
9 北大企研中心研究部 科强 楚天 一清;我惟一 我存在[N];中国计算机报;2001年
10 编译/李哲;用语音遥控家中机器人[N];北京科技报;2004年
相关博士学位论文 前7条
1 王坚;语音识别中的说话人自适应研究[D];北京邮电大学;2007年
2 季昊;稀疏编码研究及其在模式识别中的应用[D];北京邮电大学;2012年
3 陶冶;文本语音匹配的研究和应用[D];山东大学;2009年
4 田斌;实用化汉语语音识别理论及关键技术研究[D];西安电子科技大学;1999年
5 王海艳;基于统计模型的语音增强算法研究[D];吉林大学;2011年
6 潘逸倩;声纹密码技术研究[D];中国科学技术大学;2012年
7 刘青松;话者识别中失配信息补偿理论和方法研究[D];中国科学技术大学;2011年
相关硕士学位论文 前10条
1 伍斯龙;群智感知中语音识别系统的研究与实现[D];华南理工大学;2013年
2 陈成;基于语音包络特征的语音识别系统[D];西安理工大学;2010年
3 李新超;基于单片机的语音识别系统设计及实现[D];华南理工大学;2010年
4 宋阳;基于单片机的语音识别系统软件设计与开发[D];电子科技大学;2011年
5 林艳生;车载多媒体语音识别系统设计[D];辽宁工程技术大学;2011年
6 黄文涛;基于神经网络的嵌入式语音识别系统研究[D];广东工业大学;2012年
7 斯芸芸;嵌入式语音识别系统的设计与实现[D];重庆大学;2012年
8 李伟;放射科语音识别系统中环境自适应技术的研究与实现[D];浙江大学;2013年
9 庞陟儒;支持向量机语音识别系统的数据分析预选取算法研究[D];太原理工大学;2013年
10 王蓓;智能护理床语音识别系统的设计[D];南昌大学;2013年
,本文编号:1520115
本文链接:https://www.wllwen.com/kejilunwen/wltx/1520115.html