一种基于混合MELP/CELP的4 kbit/s声码器
发布时间:2020-12-21 01:55
利用混合激励线性预测(mixed excitation linear prediction,MELP)算法和码激励线性预测(code excitation linear prediction,CELP)算法的优点,提出了一种混合MELP/CELP语音编码模型。编码端对强浊音帧采用MELP编码,对弱浊音帧和清音帧进行CELP编码。MELP编码器采用相位对齐技术提取强浊音帧的相位参数,解决了合成语音与原始语音在时间上不同步的问题。对实现的4 kbit/s混合MELP/CELP声码器进行客观MOS(mean opinion score)值和主观DRT(diagnostic rhythm test)清晰度测试,结果表明,该声码器的合成语音具有较高的可懂度和清晰度。
【文章来源】:重庆邮电大学学报(自然科学版). 2017年02期 北大核心
【文章页数】:6 页
【部分图文】:
混合MELP/CELP声码器编码流程图
1为混合MELP/CELP语音编码流程框图。编码器输入的是8kHz采样、16bit均匀量化的语音信号,帧长为20ms。对经过预处理后的语音帧进行线性预测分析,得到线性预测系数和残差信号,残差信号用于后续语音特征参数的提龋编码端以语音帧的浊音强度值的大小来判定帧的类型,如果是强浊音帧,进行MELP编码,若是弱浊音帧或清音帧则采用CELP编码。在进行MELP编码时,提取强浊音帧的相位参数以实现相位对齐[6]。语音特征参数量化编码后形成比特流,最后加上指示该帧是MELP编码还是CELP编码的1bit模式判决位后打包输出。图2是混合MELP/CELP语音解码流程框图。接收端对接收到的比特流进行解码,根据模式判决信息选择相应的MELP或CELP解码算法。将解码得到的参数生成MELP模型激励源或CELP模型激励源,通过线性预测合成滤波器后,重构出语音信号。将重构的语音信号进行后置滤波[7]得到最终的合成语音信号。图1混合MELP/CELP声码器编码流程图Fig.1BlockdiagramofhybridMELP/CELPspeechcoding图2混合MELP/CELP声码器解码流程图Fig.2BlockdiagramofhybridMELP/CELPspeechdecoding2相位对齐CELP编码是以逼近原始语音波形为目的,在传输的信息中含有相位参数,因此合成的语音波形与原始语音波形在时间上是同步的。而MELP提取的原始语音特征参数中没有包含相位信息,导致了合成语音与原始语音在时间上不同步,表现出波形包络不一致。因此,混合MELP/CELP声码器不能简单地把解码后合成的语音信号进行叠接,否则在听觉上感觉会不自然,导致合成语音质量下降。为了解决相位对齐问题,MELP编码端需提取强浊音帧的相位参数。2.1相位参数的提取本文采用相关法来提取强浊音帧的相位参数。参与相关运算的一个信号是欲编码的线性?
肕ELP编码模型,对弱浊音帧和清音帧采用CELP编码模型,并利用相位对齐技术解决了MELP在提取原始语音信号特征参数[5]时没有考虑相位,造成合成语音与原始语音在时间上不同步的问题。为了与CELP声码器编码帧长一致,把MELP的编码帧长由22.5ms改为20ms,重新构建了线谱对频率(linespectrumfrequen-cy,LSF)、傅氏级数幅度语音特征参数的矢量量化码本。混合MELP/CELP的4kbit/s声码器用C语言进行了实现,经测试,本文实现的4kbit/s声码器的合成语音具有较高的可懂度和清晰度。1混合MELP/CELP声码器编解码结构图1为混合MELP/CELP语音编码流程框图。编码器输入的是8kHz采样、16bit均匀量化的语音信号,帧长为20ms。对经过预处理后的语音帧进行线性预测分析,得到线性预测系数和残差信号,残差信号用于后续语音特征参数的提龋编码端以语音帧的浊音强度值的大小来判定帧的类型,如果是强浊音帧,进行MELP编码,若是弱浊音帧或清音帧则采用CELP编码。在进行MELP编码时,提取强浊音帧的相位参数以实现相位对齐[6]。语音特征参数量化编码后形成比特流,最后加上指示该帧是MELP编码还是CELP编码的1bit模式判决位后打包输出。图2是混合MELP/CELP语音解码流程框图。接收端对接收到的比特流进行解码,根据模式判决信息选择相应的MELP或CELP解码算法。将解码得到的参数生成MELP模型激励源或CELP模型激励源,通过线性预测合成滤波器后,重构出语音信号。将重构的语音信号进行后置滤波[7]得到最终的合成语音信号。图1混合MELP/CELP声码器编码流程图Fig.1BlockdiagramofhybridMELP/CELPspeechcoding图2混合MELP/CELP声码器解码流程图Fig.2BlockdiagramofhybridMELP/CELPspeechdecoding2相位对齐CELP编码是以逼
【参考文献】:
博士论文
[1]低速率语音编码算法研究[D]. 计哲.清华大学 2011
硕士论文
[1]混合激励MVDR语音编码技术研究[D]. 马震.山东大学 2005
本文编号:2928964
【文章来源】:重庆邮电大学学报(自然科学版). 2017年02期 北大核心
【文章页数】:6 页
【部分图文】:
混合MELP/CELP声码器编码流程图
1为混合MELP/CELP语音编码流程框图。编码器输入的是8kHz采样、16bit均匀量化的语音信号,帧长为20ms。对经过预处理后的语音帧进行线性预测分析,得到线性预测系数和残差信号,残差信号用于后续语音特征参数的提龋编码端以语音帧的浊音强度值的大小来判定帧的类型,如果是强浊音帧,进行MELP编码,若是弱浊音帧或清音帧则采用CELP编码。在进行MELP编码时,提取强浊音帧的相位参数以实现相位对齐[6]。语音特征参数量化编码后形成比特流,最后加上指示该帧是MELP编码还是CELP编码的1bit模式判决位后打包输出。图2是混合MELP/CELP语音解码流程框图。接收端对接收到的比特流进行解码,根据模式判决信息选择相应的MELP或CELP解码算法。将解码得到的参数生成MELP模型激励源或CELP模型激励源,通过线性预测合成滤波器后,重构出语音信号。将重构的语音信号进行后置滤波[7]得到最终的合成语音信号。图1混合MELP/CELP声码器编码流程图Fig.1BlockdiagramofhybridMELP/CELPspeechcoding图2混合MELP/CELP声码器解码流程图Fig.2BlockdiagramofhybridMELP/CELPspeechdecoding2相位对齐CELP编码是以逼近原始语音波形为目的,在传输的信息中含有相位参数,因此合成的语音波形与原始语音波形在时间上是同步的。而MELP提取的原始语音特征参数中没有包含相位信息,导致了合成语音与原始语音在时间上不同步,表现出波形包络不一致。因此,混合MELP/CELP声码器不能简单地把解码后合成的语音信号进行叠接,否则在听觉上感觉会不自然,导致合成语音质量下降。为了解决相位对齐问题,MELP编码端需提取强浊音帧的相位参数。2.1相位参数的提取本文采用相关法来提取强浊音帧的相位参数。参与相关运算的一个信号是欲编码的线性?
肕ELP编码模型,对弱浊音帧和清音帧采用CELP编码模型,并利用相位对齐技术解决了MELP在提取原始语音信号特征参数[5]时没有考虑相位,造成合成语音与原始语音在时间上不同步的问题。为了与CELP声码器编码帧长一致,把MELP的编码帧长由22.5ms改为20ms,重新构建了线谱对频率(linespectrumfrequen-cy,LSF)、傅氏级数幅度语音特征参数的矢量量化码本。混合MELP/CELP的4kbit/s声码器用C语言进行了实现,经测试,本文实现的4kbit/s声码器的合成语音具有较高的可懂度和清晰度。1混合MELP/CELP声码器编解码结构图1为混合MELP/CELP语音编码流程框图。编码器输入的是8kHz采样、16bit均匀量化的语音信号,帧长为20ms。对经过预处理后的语音帧进行线性预测分析,得到线性预测系数和残差信号,残差信号用于后续语音特征参数的提龋编码端以语音帧的浊音强度值的大小来判定帧的类型,如果是强浊音帧,进行MELP编码,若是弱浊音帧或清音帧则采用CELP编码。在进行MELP编码时,提取强浊音帧的相位参数以实现相位对齐[6]。语音特征参数量化编码后形成比特流,最后加上指示该帧是MELP编码还是CELP编码的1bit模式判决位后打包输出。图2是混合MELP/CELP语音解码流程框图。接收端对接收到的比特流进行解码,根据模式判决信息选择相应的MELP或CELP解码算法。将解码得到的参数生成MELP模型激励源或CELP模型激励源,通过线性预测合成滤波器后,重构出语音信号。将重构的语音信号进行后置滤波[7]得到最终的合成语音信号。图1混合MELP/CELP声码器编码流程图Fig.1BlockdiagramofhybridMELP/CELPspeechcoding图2混合MELP/CELP声码器解码流程图Fig.2BlockdiagramofhybridMELP/CELPspeechdecoding2相位对齐CELP编码是以逼
【参考文献】:
博士论文
[1]低速率语音编码算法研究[D]. 计哲.清华大学 2011
硕士论文
[1]混合激励MVDR语音编码技术研究[D]. 马震.山东大学 2005
本文编号:2928964
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/2928964.html