基于GMM模型和LPC-MFCC联合特征的声道谱转换研究
发布时间:2024-03-10 11:57
声道谱转换是语音转换中的关键技术。目前,大多数语音转换方法对声道谱的转换都是先提取语音中的某一种声道特征参数,然后对其进行训练转换,进而合成转换语音。由于不同的声道特征参数表征着不同的物理和声学意义,因此这些方法通常忽略了不同声道特征参数之间可能存在的互补性。针对这一问题,研究了不同声道特征参数之间进行联合建模的方法,引入了一种由线性预测系数(LinearPredictionCoefficient,LPC)和梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficient, MFCC)联合构成的LPC-MFCC特征参数,提出了一种基于高斯混合模型(Gaussian Mixture Model, GMM)和LPC-MFCC联合特征参数的语音转换方法。为验证文中方法的有效性,仿真实验选取了基于GMM和LPC的语音转换方法进行对比,对多组实验数据进行主观和客观测试,结果表明,文中提出的语音转换方法可以获得相似度更高的转换语音。
【文章页数】:5 页
【部分图文】:
本文编号:3924756
【文章页数】:5 页
【部分图文】:
图2MFCC特征提取流程
图1基于GMM模型和LPC-MFCC联合特征的转换框图2.2.4时间对齐
图1基于GMM模型和LPC-MFCC联合特征的转换框图
为了便于阐述参数的联合过程,假设矩阵Alpc表示根据某一句语音提取得到的LPC参数,阶数为M×N,其中M表示帧数,N表示特征维度。矩阵Amfcc表示根据同一语音提取得到的MFCC参数,阶数为M×N。对两个矩阵按列拼接得到联合矩阵,即LPC-MFCC特征参数对应的矩阵,阶数大小为M....
本文编号:3924756
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3924756.html