帕金森病语音障碍深度学习的解码研究
发布时间:2020-07-12 07:16
【摘要】:利用语音障碍进行帕金森病检测是目前帕金森病早期诊断的研究热点之一。近年来基于深度学习的语音障碍检测发展迅速,且检测正确率高。由于深度学习固有的特点,使得通过深度学习网络自动学习的语音特征在医学上可解释性较差。针对这一问题该文提出研究帕金森病语音传统特征梅尔频率倒谱系数和语音深度学习特征间的关系。主要使用偏最小二乘法、多任务Lasso(Least absolute shrinkage and selection operator)和多任务弹性网三种方法展开一系列讨论。首先,该文通过卷积神经网络对语音数据集进行分类,得到预训练模型。利用预训练模型提取语音的深度学习特征,同时提取语音的梅尔频率倒谱系数,进而对以上两种特征进行相关性分析,论证该文提出方法的可行性。构造了一种从语音梅尔频率倒谱系数解码语音深度学习特征的解码框架。其次,利用偏最小二乘法对语音数据训练集的两个特征集进行多元映射,并通过对比实验确定偏最小二乘法的成分个数。利用训练集得到的偏最小二乘法模型对测试集语音的梅尔频率倒谱系数进行解码,进一步的对语音的深度学习解码特征进行质量检验,并对偏最小二乘法模型进行分析。再次,利用多任务Lasso实现对语音数据训练集的两个特征集间的多元映射,通过对比实验实现对多任务Lasso模型参数的优化。利用优化后多任务Lasso模型实现对测试集语音梅尔频率倒谱系数的解码,对语音的深度学习解码特征进行质量检验,并对分多任务Lasso模型进行分析。最后,利用多任务弹性网实现对语音数据训练集的两个特征集多元映射,通过多组对比实验完成对多任务弹性网模型参数的优化。利用优化后多任务弹性网模型实现对测试集语音梅尔频率倒谱系数的解码,对语音的深度学习特征进行质量检验,并对多任务弹性网模型进行。同时对比分析该文所提出的三种多元映射方法在对语音梅尔频率倒谱系数进行解码的过程中的表现。
【学位授予单位】:燕山大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP18;TN912.3;R742.5
【学位授予单位】:燕山大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP18;TN912.3;R742.5
【相似文献】
相关期刊论文 前10条
1 车环宇;赵凌志;倪雪;滕国生;车
本文编号:2751612
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2751612.html