当前位置:主页 > 科技论文 > 信息工程论文 >

基于GMM语音谱包络表示的编码算法研究

发布时间:2018-03-31 06:13

  本文选题:语音编码 切入点:语音端点检测 出处:《南京师范大学》2017年硕士论文


【摘要】:低速率语音编码和极低码率语音编码是现代语音编码技术研究和发展的一个重要方向。对于语音编码技术来说,降低比特率是其不断发展的目标和动力。语音端点检测是语音编码过程中的重要一环,本文在研究了基础的基于方差的语音端点检测算法的基础上,提出基于ERB尺度子带划分的方差语音端点检测算法。实验结果表明,本文提出的基于ERB尺度划分的方差语音端点检测算法与基础的方差语音端点检测算法以及基于Bark尺度划分的方差语音端点检测算法相比,检测正确率,错检率,漏检率均有相应的改进。本文在深入研究基于高斯混合模型(Gaussian Mixture Model, GMM)对语音谱包络参数化表示的语音编码方法的基础上,提出一种分段编码改进算法。该算法将固定数量的语音帧划分为一个片段,在GMM对短时语音谱包络进行参数化的基础上,利用多项式拟合语音片段内的GMM参数,从而使得参数数量减少。仿真结果表明,本文算法码率对比基本的基于GMM的语音编码器有明显降低。另外本文还提出一种基于改进的高斯混合模型的甚低码率语音编码器。该编码器将多帧GMM参数组成一个超帧,对多帧参数联合编码,改进了 GMM模型,并用新模型对语音谱包络进行参数化表示。仿真结果表明,该编码器降低了编码速率,在0.86kb/s时仍然可以获得可接受的解码语音。
[Abstract]:Low rate speech coding and very low bit rate speech coding are an important direction in the research and development of modern speech coding technology. Speech endpoint detection is an important part of speech coding. In this paper, based on the research of the basic speech endpoint detection algorithm based on variance, the speech endpoint detection algorithm based on variance is studied. A speech endpoint detection algorithm based on ERB scale subband partition is proposed. The experimental results show that, Compared with the variance speech endpoint detection algorithm based on the ERB scale partition and the variance speech endpoint detection algorithm based on the Bark scale partition, the detection accuracy and error detection rate of the variance speech endpoint detection algorithm proposed in this paper are compared with those of the basic variance speech endpoint detection algorithm and the variance speech endpoint detection algorithm based on the Bark scale partition. In this paper, we study the speech coding method based on the Gao Si mixed model Gaussian Mixture Model (GMMM) for parameterized representation of the envelope of speech spectrum. An improved piecewise coding algorithm is proposed, in which a fixed number of speech frames are divided into a segment. On the basis of the GMM parameterization of the short-time speech spectrum envelope, the polynomial is used to fit the GMM parameters in the speech segment. Thus, the number of parameters is reduced. The simulation results show that, In addition, a very low bit-rate speech coder based on the improved Gao Si hybrid model is proposed. This encoder consists of multiple GMM parameters to form a superframe. The GMM model is improved for multi-frame parameter joint coding, and the new model is used to parameterize the speech spectrum envelope. The simulation results show that the encoder reduces the coding rate and can still obtain acceptable decoded speech in 0.86kb/s.
【学位授予单位】:南京师范大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TN912.3

【相似文献】

相关期刊论文 前10条

1 何俊;张华;;基于唇动特征的语音端点检测[J];微计算机信息;2008年26期

2 陈凤翥;;基于熵的语音端点检测方法探讨[J];技术与市场;2008年09期

3 雷鸣;李学仁;李果;;飞机舱音背景声下的鲁棒语音端点检测[J];振动与冲击;2008年10期

4 韩立华;王博;段淑凤;;语音端点检测技术研究进展[J];计算机应用研究;2010年04期

5 果永振,何遵文;一种多特征语音端点检测算法及实现[J];通信技术;2003年01期

6 刘鹏,王作英;多模式语音端点检测[J];清华大学学报(自然科学版);2005年07期

7 刘晓明,覃胜,刘宗行,江泽佳;语音端点检测的仿真研究[J];系统仿真学报;2005年08期

8 茹海峰,殷业;基于与图像相结合的语音端点检测方法研究[J];仪器仪表学报;2005年S1期

9 张岳;韩子丹;戴志强;;普通话孤立词语音端点检测的分形维方法研究[J];中国传媒大学学报(自然科学版);2006年01期

10 赵高峰;张雪英;侯雪梅;;一种基于小波系数方差的语音端点检测方法[J];太原理工大学学报;2006年05期

相关会议论文 前10条

1 王明;刘好新;张歆奕;;一种基于时频方差和的语音端点检测方法研究[A];教育部中南地区高等学校电子电气基础课教学研究会第二十届学术年会会议论文集(下册)[C];2010年

2 杨雅婷;马博;王磊;吐尔洪·吾司曼;李晓;;基于声频特征的维吾尔语语音端点检测方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年

3 李军;张兆宁;王旭芳;;一种强噪声背景下的语音端点检测方法[A];全国第二届信号处理与应用学术会议专刊[C];2008年

4 茹海峰;殷业;;基于与图像相结合的语音端点检测方法研究[A];第三届全国信息获取与处理学术会议论文集[C];2005年

5 张晓雷;吴及;吕萍;;基于支持向量机与多观测复合特征矢量的语音端点检测[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年

6 张晓雷;吴及;吕萍;;基于支持向量机与多观测复合特征矢量的语音端点检测[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年

7 张清芳;杨玉芳;;汉语单音节词汇产生中音韵编码的单元[A];第六届全国现代语音学学术会议论文集(下)[C];2003年

8 刘婕;高鸿斌;王洁;;噪声环境下基于关联维的语音端点检测(英文)[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年

9 李建民;方棣棠;;语音端点检测中门限阈值的自动确定及音节切割的新判据[A];第一届全国语言识别学术报告与展示会论文集[C];1990年

10 蒋纯纲;屈百达;李金宝;王月;;基于小波变换后的分形理论的语音端点检测[A];2007中国控制与决策学术年会论文集[C];2007年

相关重要报纸文章 前2条

1 浙江 汤向锋 周宁;改善华为C8600智能手机通话质量的方法[N];电子报;2012年

2 彭;灵活与保密兼具[N];中国计算机报;2003年

相关博士学位论文 前4条

1 齐峰岩;低速率波形内插语音编码关键技术的研究[D];北京工业大学;2007年

2 王都生;多带混合激励低速率语音编码的研究[D];西安电子科技大学;1998年

3 张文耀;基于匹配跟踪的低位率语音编码研究[D];中国科学院研究生院(软件研究所);2002年

4 昝飞;聋生汉字加工中语音编码作用的实验研究[D];华东师范大学;2002年

相关硕士学位论文 前10条

1 王蓉蓉;基于GMM语音谱包络表示的编码算法研究[D];南京师范大学;2017年

2 王海旭;基于卷积神经网络的语音端点检测方法研究[D];内蒙古大学;2015年

3 张松轶;语音端点检测技术及在应急通信中的应用[D];西安电子科技大学;2009年

4 李乐;语音端点检测算法的研究及应用[D];西安建筑科技大学;2016年

5 张超;语音端点检测方法研究[D];大连理工大学;2016年

6 杨晓海;基于语音端点检测的移动设备无障碍出行服务助手的研究与实现[D];浙江大学;2017年

7 魏浩然;基于统计模型的语音端点检测[D];上海师范大学;2017年

8 刘洋;基于神经网络的语音端点检测方法研究[D];大连理工大学;2010年

9 赵丽霞;噪声环境下基于特征的语音端点检测研究[D];湖南大学;2010年

10 夏敏磊;语音端点检测技术研究[D];浙江大学;2005年



本文编号:1689495

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1689495.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户699f9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com