基于声学特征和人脸表情的抑都症辅助检测算法研究
发布时间:2020-04-05 05:33
【摘要】:抑郁症是一类常见的心理精神疾病,其以高患病率、高发生率等危害成为严重的精神疾病之一。通过临床诊断和研究发现,抑郁症患者声音中所表现出的低沉、缓慢、单一等特点是异于常人的,因此,采用语音声学特征作为客观指标对抑郁症进行诊断研究已成为近年来研究的热点。此外,面部表情的变化也是传达情感的方式,因此,本文提出一种新的融合语音信号和人脸表情的自动抑郁症辅助检测算法,具体工作如下:(1)针对抑郁语音发声特点,提出一种针对抑郁类语音的信号增强算法,探究不同特征参数在多情感语音中的有效区分力。本文采用一种改进型谱减算法对抑郁类语音进行语音增强,应用统计分析法对多类情感语音的特征变化规律进行统计分析,通过实验最终确定将基音频率、前三共振峰、能量以及短时平均幅度特征作为区分不同情感语音的有效特征。(2)结合不同情感语音的发声特点,提出一种新的融合语音信号和人脸表情共同识别的抑郁症辅助检测算法。基于上述对多情感语音特征值的分析,找到与抑郁语音相似度高的情感语音,选取梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)为特征参数,通过实验选择合适的网络结构、确定网络参数,建立BP神经网络—抑郁类识别模型进行判别。采用稀疏表示算法对不同表情所属状态判别归类。实验结果表明,融合语音和人脸表情的抑郁症辅助判别算法,在相似情感类别的判断中也可作为诊断抑郁症的辅助手段。(3)基于对上述抑郁识别模型的研究,实现了基于BP神经网络的Adaboost算法,并设计了自动抑郁症辅助检测系统界面。待确定BP神经网络结构后,通过不断加入弱分类器,进行反复迭代,以满足预设的误差率,达到有效分类。实验表明,Adaboost算法在相似度高的情感语音之间能够起到较好的判别作用。此外,本文设计的系统界面不仅成本低廉、操作便捷,且在实际使用中也可做到对患者隐私的保护,达到了双赢。
【图文】:
31图 17 Cool Edit Pro 视频编辑3.4.2 情感语音特征分析本文对六类情感语音进行基音频率提取,统计值如表 6 所示。选取高兴、害怕、郁和正常四类情感进行如下示意。
第三章 基于语音信号的抑郁症辅助检测系统设计与实现设计别率达到最理想,神经网络参数的配置起到了很重要的作设计,探究隐含层节点数的不同对网络收敛速度及识别准增强前的语音库和信号增强后的语音库,输入特征选择 M样本,,30%作为测试样本,在隐含层节点数设置为 5、10、用 5 次交叉验证后的平均值作为最终识别率,如表 7 和图表 7 不同神经元数在自建抑郁语音库下的正确率元数 5 10 15 20 别率 66.3% 68.2% 71.7% 76.2% 别率 69.4% 73.9 75.1% 84.4%
【学位授予单位】:西北大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:R749.4;TN912.34
【图文】:
31图 17 Cool Edit Pro 视频编辑3.4.2 情感语音特征分析本文对六类情感语音进行基音频率提取,统计值如表 6 所示。选取高兴、害怕、郁和正常四类情感进行如下示意。
第三章 基于语音信号的抑郁症辅助检测系统设计与实现设计别率达到最理想,神经网络参数的配置起到了很重要的作设计,探究隐含层节点数的不同对网络收敛速度及识别准增强前的语音库和信号增强后的语音库,输入特征选择 M样本,,30%作为测试样本,在隐含层节点数设置为 5、10、用 5 次交叉验证后的平均值作为最终识别率,如表 7 和图表 7 不同神经元数在自建抑郁语音库下的正确率元数 5 10 15 20 别率 66.3% 68.2% 71.7% 76.2% 别率 69.4% 73.9 75.1% 84.4%
【学位授予单位】:西北大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:R749.4;TN912.34
【参考文献】
相关期刊论文 前6条
1 傅小兰;王辉;范伟;;抑郁症患者的面部表情识别研究[J];心理与行为研究;2015年05期
2 陶华伟;g
本文编号:2614616
本文链接:https://www.wllwen.com/kejilunwen/wltx/2614616.html