一种区分性互补系统构造与融合的语音识别方法
本文选题:模型层 切入点:语音识别 出处:《声学学报》2016年01期
【摘要】:在区分性训练的框架下,提出了一种基于混淆信息加权的互补系统构造方法。首先通过统计音素对的混淆信息,利用混淆信息给音素对加以不同的惩罚权重,分别以基线系统中的3个最优识别结果作为参考,计算混淆信息加权后的音素准确率,同时以正确的标注为参考计算标准的音素准确率。然后通过同时最大化混淆信息加权后的音素准确率和最小化标准音素准确率,构建模型层互补系统,并进一步通过结合RDLT(region-dependent linear transform)特征变换过程构造特征层的互补系统。实验结果表明,与互补最小音素错误准则相比,融合模型层互补系统后识别率提高了0.76%,同时融合特征层和模型层的互补系统识别率提高了1.35%。本方法可以增大互补系统间的差异性,提高系统融合后的识别性能。
[Abstract]:In the framework of discriminative training, a complementary system construction method based on weighted confounding information is proposed. Firstly, by using the confounding information of phoneme pairs, the confounding information is used to give different penalty weights to phoneme pairs. Based on the three optimal recognition results in the baseline system, the phoneme accuracy of weighted confounding information is calculated. At the same time, the correct tagging is used as the reference to calculate the phoneme accuracy. Then, by maximizing the weighted phoneme accuracy of confused information and minimizing the standard phoneme accuracy, a model level complementary system is constructed. Furthermore, the complementary system of the feature layer is constructed by combining the RDLT(region-dependent linear transform process. The experimental results show that, compared with the complementary minimum phoneme error criterion, The recognition rate of complementary system at model level is improved by 0.76 and the recognition rate of complementary system by combining feature layer and model layer is improved by 1.35. This method can increase the difference between complementary systems and improve the recognition performance after system fusion.
【作者单位】: 解放军信息工程大学信息系统工程学院;
【基金】:国家自然科学基金(61175017) 国家高技术研究发展计划(863)(2012AA011603)资助
【分类号】:TN912.34
【参考文献】
相关期刊论文 前3条
1 顾晓江;赵鹤鸣;吕岗;;模型与特征混合补偿法及其在耳语说话人识别中的应用[J];声学学报;2012年02期
2 杨海;张翔;梁春燕;索宏彬;颜永红;;联合因子分析和稀疏表示在稳健性说话人确认中的应用[J];声学学报;2012年05期
3 陈斌;张连海;屈丹;李弼程;;一种广义边距区分性训练准则[J];声学学报;2014年01期
【共引文献】
相关期刊论文 前6条
1 何建超;章坚武;吴震东;;一种基于筛选高斯分量的说话人确认方法[J];杭州电子科技大学学报(自然科学版);2015年06期
2 ZHOU Jian;ZHENG Wenming;WANG Qingyun;ZHAO Li;;Intelligibility enhancement for noisy whispered speech using asymmetric cost function[J];Chinese Journal of Acoustics;2014年03期
3 曾理;张雄伟;陈亮;杨吉斌;黄建军;;分段匹配追踪式Karhunen-Loeve非相干字典语音压缩感知[J];声学学报;2013年04期
4 周健;郑文明;王青云;赵力;;提高耳语音可懂度的非对称压缩语音增强方法[J];声学学报;2014年04期
5 梁春燕;杨琳;周若华;颜永红;;韵律特征在概率线性判别分析说话人确认中的应用[J];声学学报;2015年01期
6 王瑞;王康晏;冯玉田;张海燕;金彦亮;张有正;;复杂场景下声频传感器网络核稀疏表示车辆识别[J];西安电子科技大学学报;2015年04期
相关博士学位论文 前2条
1 吴迪;智能环境下基于视听信息多层级融合的身份识别[D];兰州理工大学;2014年
2 龚呈卉;基于联合因子分析的耳语音说话人识别研究[D];苏州大学;2014年
相关硕士学位论文 前1条
1 吕英;音频事件识别信道自适应方法研究[D];北京理工大学;2015年
【二级参考文献】
相关期刊论文 前7条
1 吴娅辉;刘刚;郭军;;基于模型混淆度的模型组合算法研究[J];自动化学报;2009年05期
2 郭武;李轶杰;戴礼荣;王仁华;;说话人识别中的因子分析以及空间拼接[J];自动化学报;2009年09期
3 郭武;戴礼荣;王仁华;;说话人识别中的串行因子分析[J];模式识别与人工智能;2009年04期
4 国雁萌;付强;颜永红;;复杂噪声环境中的语音端点检测[J];声学学报;2006年06期
5 张建平;李明;索宏彬;杨琳;付强;颜永红;;长时语音特征在说话人识别技术上的应用[J];声学学报;2010年02期
6 李轶杰;郭武;戴礼荣;;话者识别的信道补偿[J];小型微型计算机系统;2008年12期
7 梁春燕;张翔;杨琳;张建平;颜永红;;最小方差无失真响应感知倒谱系数在说话人识别中的应用[J];声学学报;2012年06期
【相似文献】
相关期刊论文 前10条
1 祝义;AMVC模型的设计与应用[J];福建电脑;2005年11期
2 胡长城;;现实篇:模型与技术的搏弈[J];软件世界;2007年14期
3 张朋柱,张梅,韩崇昭,万百五;决策支持过程控制:问题-模型-求解递阶分层法[J];控制与决策;1993年04期
4 龚报钧,王树青;模型层MAS模型的获取和实现方法[J];计算机工程与应用;2001年19期
5 刘威;乔立红;;基于元模型的统一制造资源模型框架[J];计算机集成制造系统;2007年10期
6 李静;;高校图书馆电子资源使用过程中用户情境模型的构建与应用[J];情报理论与实践;2009年02期
7 李海峰,金昊,吴介一;采用XMI标准实现UML模型到XML的转换[J];制造业自动化;2003年04期
8 柴兴无;乔京成;陈芸生;;对多媒体数据库管理系统的层次结构分析[J];计算机科学;1995年01期
9 王建光;段富;;一种UML模型到XML模型的转换方法[J];计算机技术与发展;2007年07期
10 张恩慧;陶振凯;;MVC模式在Asp.net下的分析[J];硅谷;2008年18期
相关会议论文 前1条
1 潘志勇;李红燕;;一种MVC架构中的数据组织方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
相关博士学位论文 前6条
1 单黎君;图形化模型的一致性检查[D];国防科学技术大学;2008年
2 李响烁;PLM开发实施进程与集成产品元模型研究[D];浙江大学;2007年
3 江涛;特定领域元建模语言的形式化及其模型一致性验证研究[D];云南大学;2010年
4 薛斌党;嵌入式隐Markov模型和神经网络人脸识别[D];大连理工大学;2002年
5 张楚贤;基于元模型的工程系统仿真建模方法及应用研究[D];华中科技大学;2011年
6 秦飞巍;基于语义的异构三维CAD模型检索[D];浙江大学;2014年
相关硕士学位论文 前10条
1 柴叶生;基于MARTE模型的系统性能评估[D];苏州大学;2015年
2 张媛;基于有线电视宽带网的电子商务模型中心平台模型层的研究与实现[D];昆明理工大学;2004年
3 田刚;基于元模型的PIM到PSM转换技术研究[D];山东科技大学;2007年
4 宋亮亮;基于模型的软件工具链的设计与实现[D];汕头大学;2009年
5 李明宇;UML模型一致性检测的研究[D];山东大学;2005年
6 张芳;面向电子商务的Web应用元模型的研究与实现[D];国防科学技术大学;2004年
7 陈曦;可视化建模工具中模型一致性问题研究[D];哈尔滨工程大学;2008年
8 耿同成;一种基于MOF的模型可执行方法的研究与实现[D];吉林大学;2008年
9 余东亮;基于模型的云应用动态管理技术研究[D];南京大学;2015年
10 骆文亮;油气供给模型方法研究与软件实现[D];西南石油大学;2010年
,本文编号:1663948
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1663948.html