甚低速率语音编码算法研究
发布时间:2020-04-17 00:25
【摘要】:近年来随着数字化通信技术的高速发展,频率资源越发宝贵。降低语音编码速率可以提高信道的利用率和节约开销,对实践有极大的指导意义和实用价值。因此低速率语音编码是未来语音编码技术的重要发展方向之一。混合激励线性预测算法是低速率语音编码(MELP)算法中最具潜力的编码器之一,它以线性预测模型为基础,结合多带思想,新增五项关键技术,使合成语音质量明显提升。本文以联邦标准MELP为基础研究对象。通过了解MELP算法的基本原理和实现方法,并进行系统的研究和分析,设计了一种0.6kb/s的甚低速率语音编解码算法。同时详细分析各个参数对合成语音质量的影响,从清浊音判决和基音周期两方面改进,以提高合成语音的质量。0.6kb/s算法的实现是采用联合帧的思想。本论文在MELP模型基础上增加处理帧长到200个样点,并将四帧组成一个超帧,以超帧为单位对参数进行量化传输,超帧共量化60bit。四个子帧的清浊状态共有16种组合,根据它们出现的概率,我们划分为四种模式或者两大类,分别代表清音类和浊音类。根据不同的分类对提取的参数进行最优的比特分配。清音类不传输基音周期,每个子帧的10个LSF参数均用一级矢量器量化为11比特。浊音类的超帧中的后三个子帧的基音周期进行均匀量化传输,第一子帧基音周期不传输。对于线谱频率,只有第二子帧和第四子帧的LSF被传输和量化,每子帧LSF使用一级矢量器量化为11比特。增益是为了使合成语音与原信号幅度相匹配。分别从第二子帧和第四子帧提取两个增益,将这四个增益组合一个四维矢量,用矢量量化器将这个矢量量化为10比特。其它的比特用来传输子带清浊判决,其中第一子带清浊判决必须传输。在解码端,首先根据第一子带的清浊判决情况进行模式判断,然后再进行参数译码和插值恢复四组参数。超帧矢量量化方法使标准MELP编码算法速率降低到0.6kb/s。测试结果表明,0.6kb/s的编码算法合成语音质量PESQ值为2.18,比标准算法PESQ值平均低了0.534,合成语音的可懂度高。提高合成语音质量从清浊音判决和基音周期两方面进行改进。首先在编码端将增加一种语音判决,即过渡段。将清音误判为浊音处理,对合成语音质量影响不大,反之将浊音判为清音处理,音质变差,因此采取自适应窗提取过渡段线性预测系数,使其提取的预测系数包含更多的浊音信息。其次在提取基音周期时,对输入的语音信号进行上采样,因为上采样可以使数字信号更接近于原始模拟信号,使提取基音周期能更准确,因此能提高合成语音质量。测试结果表明基音周期和过渡段线性预测分析的改进使MELP标准算法的PESQ值提升了0.061。
【学位授予单位】:西安电子科技大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TN912.3
本文编号:2630221
【学位授予单位】:西安电子科技大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TN912.3
【参考文献】
相关期刊论文 前1条
1 丛键;张知易;;一种600bps极低速率语音编码算法[J];电子与信息学报;2007年02期
,本文编号:2630221
本文链接:https://www.wllwen.com/kejilunwen/wltx/2630221.html