基于免疫猫群优化算法的矢量量化的码书设计及语音识别
本文选题:猫群优化算法 + 克隆扩增 ; 参考:《模式识别与人工智能》2014年07期
【摘要】:在矢量量化的码书设计过程中,针对传统的LBG算法对初始码书选取的依赖性及易陷入局部最优的缺陷,提出基于免疫猫群优化算法的矢量量化码书设计.将整个种群分为搜索组和跟踪组,运用克隆扩增算子在搜寻组中进行局部搜索,根据适应度值大小调节变异个体数目,保持解的多样性.运用动态疫苗提取与接种算子使跟踪组个体基因与疫苗进行交叉变异,向最优解靠拢,防止无监督交叉变异可能引起的退化现象.通过浓度平衡算子和选择算子更新子代种群,防止种群"早熟".将训练出全局最优码书输入到HMM模型进行训练和识别,实验结果表明,基于免疫猫群优化算法的矢量量化码书设计不依赖于初始码书选取,鲁棒性强且降低语音识别误差率.
[Abstract]:In the course of codebook design of vector quantization (VQ), a novel codebook design based on immune Cat Swarm Optimization (IQSO) is proposed to overcome the dependence of the traditional LBG algorithm on the initial codebook selection and the defect that it is easy to fall into the local optimal condition. The whole population is divided into search group and tracking group. Local search is carried out in search group by clone amplification operator, and the number of variant individuals is adjusted according to fitness value, and the diversity of solution is maintained. Dynamic vaccine extraction and inoculation operators are used to make individual genes in the tracking group cross mutate with the vaccine in order to close to the optimal solution to prevent possible degradation caused by unsupervised crossover mutation. The concentration balance operator and the selection operator are used to renew the progeny population to prevent the population from precocity. The global optimal codebook is input into the HMM model for training and recognition. The experimental results show that the vector quantization codebook design based on immune cat swarm optimization algorithm does not depend on the initial codebook selection and is robust and reduces the speech recognition error rate.
【作者单位】: 天津理工大学智能计算及软件新技术重点实验室;
【基金】:国家自然科学基金项目(No.61001174) 天津市高等学科科技发展基金项目(No.20071308)资助
【分类号】:TN912.34
【相似文献】
相关期刊论文 前10条
1 许织新;;码书矢量量化设计算法[J];遥测遥控;1989年03期
2 郑巍,余涛;图像矢量量化编码算法的回顾和比较[J];中国有线电视;2002年23期
3 高艳,华刚,孙国基;新型混合矢量码书快速匹配算法[J];微电子学与计算机;2003年02期
4 程群杰,董智斌,,张子范,张吉庆;灰度图象的快速矢量量化[J];兰州大学学报(自然科学版);1995年03期
5 李霞,罗雪晖,张基宏;一种快速模拟退火矢量量化图像编码算法[J];系统工程与电子技术;2003年03期
6 杨云志;黄顺吉;王建国;;SAR原始数据矢量量化的码书改进研究[J];现代雷达;2007年11期
7 郑勇,周正华,朱维乐;二维网格编码矢量量化及其在静止图像量化中的应用[J];电子与信息学报;2002年12期
8 李弼程,胡宗云;基于小波变换的图像矢量量化[J];信号处理;2000年01期
9 ;ISO/IECMPEG-2先进音频编码(三)[J];电声技术;1998年12期
10 郭东亮,吴乐南;基于联合准则的码书设计算法[J];电路与系统学报;2001年04期
相关会议论文 前10条
1 吕良飞;罗长江;周鹏;;基于分形的图像矢量量化器[A];中国仪器仪表学会第三届青年学术会议论文集(上)[C];2001年
2 李锐;鲍长春;;一种CELP语音编码器中帧擦除掩蔽的有效方法[A];第十三届全国信号处理学术年会(CCSP-2007)论文集[C];2007年
3 刘增寿;朱东升;;一个实时汉语语音识别新算法SSVQ/DTW[A];第二届全国人机语音通讯学术会议论文集[C];1992年
4 程兰颖;俞铁城;;任意发音内容的发音人辨识[A];第二届全国人机语音通讯学术会议论文集[C];1992年
5 刘建;张渊;俞铁城;;汉语连续语流中浊音音段切分对识别影响研究[A];第四届全国人机语音通讯学术会议论文集[C];1996年
6 陈善学;;矢量量化快速编码算法[A];第九届全国青年通信学术会议论文集[C];2004年
7 张庆芳;赵鹤鸣;苏秦;;基于改进Kohonen网络训练算法的说话人识别系统[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
8 李宏言;盛利元;陈妮;;一种基于矢量量化和查找表的改进DTW语音识别方法[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
9 辛杰;鲍长春;;一种基于安全网扩展的宽带ISF参数矢量量化方法[A];第九届全国人机语音通讯学术会议论文集[C];2007年
10 秦勇;莫福源;李昌立;关定华;;汉语超大词汇语音识别系统的研究与实现[A];第四届全国人机语音通讯学术会议论文集[C];1996年
相关博士学位论文 前4条
1 田斌;实用化汉语语音识别理论及关键技术研究[D];西安电子科技大学;1999年
2 石敏;图像压缩编码及低比特率下去块效应算法的研究[D];华南理工大学;2005年
3 郑勇;小波图像分类矢量量化与网络编码量化的研究[D];电子科技大学;2002年
4 张之学;搭线窃听网络中的安全网络编码[D];北京邮电大学;2010年
相关硕士学位论文 前10条
1 皇甫丽英;G.728算法改进及低码率LD-CELP算法研究[D];太原理工大学;2002年
2 银磊;量子码图像压缩算法码书的研究及其解码电路的实现[D];西安理工大学;2005年
3 刘小春;基于SVC的无线视频质量编码与传输技术研究与实现[D];华中师范大学;2013年
4 胡又文;基于FPGA的嵌入式说话人识别系统实现[D];重庆大学;2007年
5 刘泽新;8~32kb/s宽带嵌入式变速率语音编解码算法研究[D];北京工业大学;2007年
6 周延献;感知音频编码算法研究[D];天津大学;2012年
7 王炼;小波变换和混合神经网络在图像压缩中的应用研究[D];哈尔滨工程大学;2006年
8 李宏言;小词汇量汉语孤立词语音识别的理论与技术研究[D];中南大学;2006年
9 龚小燕;极低速率语音通信的实现[D];山东大学;2009年
10 马红杰;基于FPGA的DRA音频编解码算法的研究与实现[D];南昌大学;2011年
本文编号:1927395
本文链接:https://www.wllwen.com/kejilunwen/wltx/1927395.html