衰减加权线性预测的声道面积估计及病理嗓音识别研究
发布时间:2020-07-25 09:58
【摘要】:嗓音是由声带和声道的共同作用产生,其质量取决于两者。研究表明声门上喉管的声道对嗓音病理有明确的影响。本文研究声道面积估计及其在病理嗓音识别中的应用。从声道滤波器中估计声道面积,会受到声门波信号的干扰和非理想边界条件的影响。为了最小化这些因素产生的干扰,本文提出了一种声门闭相下衰减加权线性预测估计声道面积的方法。针对现有嗓音特征对病理嗓音识别细分工作存在的局限性,以声门闭相下获得的声道面积函数为基础,提取声道面积特征参数,进一步研究正常嗓音与病理嗓音的识别以及不同病理嗓音之间的细分。具体研究内容如下:(1)提出衰减加权线性预测估计声道面积的方法,在不减少分析数据量的基础上,削弱声门开启相的影响,同时强调声门闭相的作用。将声门闭相下数据点的预测误差权重设置为1,衰减开相下数据点的预测误差权重,将其设置为一个正的极小值,然后在所有数据点加权均方误差最小的条件下求解预测系数。根据声道滤波器模型和声管模型的等效,递推得到反射系数与声道面积的函数关系,最后迭代计算声道面积函数。计算同一段语音数据的声道面积,结果表明,与核磁共振获得的标准声道面积比较,VTA-HPV(vocal tract area-half peak value)的归一化均方误差为0.15,本方法VTA-WLP(vocal tract area-weighted linear prediction)估计的面积均方误差为0.03,表明本方法估计更为准确。(2)提出了WLPAP(weighted linear prediction area parameters)特征向量组,从VTA-WLP获得的声道面积函数中提取出反映各类异常嗓音的声道面积特征参数,构造基于声道面积特征的识别系统,将量化的不规则声道面积用于研究正常嗓音与病理嗓音(声带小结与声带息肉)的识别与细分。对本文提取的WLPAP特征参数进行相关性和差异性分析,表明正常和病理嗓音声道参数间存在差异,辅助病理嗓音识别并进一步分类声带小结与声带息肉疾病。本文提取的声道面积特征能够实现最高97%的细分准确率,在正常嗓音与病理嗓音的识别效果上,本文提出的系统获得了99.21%的准确性。本文为声道面积的估计及病理嗓音的识别研究提供新的思路和方法。
【学位授予单位】:苏州大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TN713;R767.92
【图文】:
图 2.1 声道形状模型由 Schroeder 提出[48],声道由多个长度相等、截面积“声管模型”,如图 2.2 所示。忽略鼻共振腔,可以将声管子,从声门到肺这部分有固定的横截面积,而从声门到,因此可以将声门到唇这段声道看成是一根细微变化、无u0u+m(t,dm)u-m(t,dm)u+m-1(t,dm-1)u-m-1(t,dm-1)L
表 5.1 反射系数的估计误差Err_aLF 模型测试组 A B CCP_WLP 1.92 1.87 2.24CP_HPV 2.68 2.64 2.65表 5.2 声门源参数估计误差Err_NAQ Err_QOQ Err_SrLF 模型测试组 A B C A B C A B CCP_WLP 3.75 24.32 17.25 11.22 9.34 12.2 5.81 35.35 9.92CP_HPV 5.12 40.13 17.01 27.32 17.76 26.83 8.32 63.69 4.07IAIF 22.31 48.27 44.38 43.91 16.82 26.83 50.64 94.08 38.81
本文编号:2769674
【学位授予单位】:苏州大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TN713;R767.92
【图文】:
图 2.1 声道形状模型由 Schroeder 提出[48],声道由多个长度相等、截面积“声管模型”,如图 2.2 所示。忽略鼻共振腔,可以将声管子,从声门到肺这部分有固定的横截面积,而从声门到,因此可以将声门到唇这段声道看成是一根细微变化、无u0u+m(t,dm)u-m(t,dm)u+m-1(t,dm-1)u-m-1(t,dm-1)L
表 5.1 反射系数的估计误差Err_aLF 模型测试组 A B CCP_WLP 1.92 1.87 2.24CP_HPV 2.68 2.64 2.65表 5.2 声门源参数估计误差Err_NAQ Err_QOQ Err_SrLF 模型测试组 A B C A B C A B CCP_WLP 3.75 24.32 17.25 11.22 9.34 12.2 5.81 35.35 9.92CP_HPV 5.12 40.13 17.01 27.32 17.76 26.83 8.32 63.69 4.07IAIF 22.31 48.27 44.38 43.91 16.82 26.83 50.64 94.08 38.81
【参考文献】
相关期刊论文 前1条
1 俞振利,张礼和,曾尚璀;从语音信号的有限个共振峰频率估计声道面积参数的一个方法[J];电子学报;1997年07期
相关硕士学位论文 前2条
1 常静雅;小波域多重分形和能量谱参数的病理嗓音识别研究[D];苏州大学;2016年
2 张凯晗;基于逆滤波提取声门波方法的研究与实现[D];暨南大学;2015年
本文编号:2769674
本文链接:https://www.wllwen.com/kejilunwen/dianzigongchenglunwen/2769674.html