病态嗓音特征提取及识别研究
发布时间:2021-07-31 22:43
嗓音是人类进行沟通与交流的重要工具,嗓音好坏对人们的言语表达有直接的影响。声带作为发声系统的重要组成部分,其病变是导致嗓音出现问题的重要原因。采用声学分析技术对病理嗓音信号进行分析和研究,可以实现对嗓音质量的客观评估,对喉部疾病的诊断和治疗具有临床指导意义。随着研究的深入,临床上对声带类嗓音疾病细分类的研究已成为病理性嗓音检测的热点。随着计算机处理能力的提升,深度学习在语音识别领域取得了显著效果。本文针对声带类嗓音疾病的分类问题和利用卷积神经网络实现嗓音疾病的分类问题上进行了相关研究,主要包括以下三个方面的内容。1.本文针对声带类疾病分类时参数选择存在的局限性,从非线性和统计学角度出发,提出了小波包多尺度分析的嗓音特征提取方法,以提高声带类嗓音疾病的识别率。首先,使用小波包技术将原始嗓音信号进行分解,得到不同频段的子信号,然后从不同频带中提取非线性特征Hurst指数、2-Rényi熵、计盒维数和吸引子用以评估每个频带在检测和分类病理嗓音过程中的贡献。将提取的多尺度特征进行组合,使用支持向量机(Support Vector Machine,SVM)对不同数据库的正常和病态嗓音信号进行二分...
【文章来源】:广西师范大学广西壮族自治区
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
最优分类超平面
图 4-9 采用延迟时间嵌入理论重构的 3 维状态空间号的相空间重构轨迹图像程中,在使用 CNN 对两类嗓音信号进行分类时,输入到网络中的样本,首先要将重构的三维空间轨迹图在二维平面上进行投影,得到二维轨迹的二维图像进行一定的预处理操作,将背景设置为黑色,去除坐标轴,分辨率设置为 224*224,经过预处理的图像将作为 CNN 的输入,通过有常和病理声音的分类。以 MEEI 数据库中正常和病态嗓音信号为例,投像如图 4-10 所示,从投影得到的二维轨迹图可以看出,其二维图像仍保的基本形状和分类特征。
本文编号:3314313
【文章来源】:广西师范大学广西壮族自治区
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
最优分类超平面
图 4-9 采用延迟时间嵌入理论重构的 3 维状态空间号的相空间重构轨迹图像程中,在使用 CNN 对两类嗓音信号进行分类时,输入到网络中的样本,首先要将重构的三维空间轨迹图在二维平面上进行投影,得到二维轨迹的二维图像进行一定的预处理操作,将背景设置为黑色,去除坐标轴,分辨率设置为 224*224,经过预处理的图像将作为 CNN 的输入,通过有常和病理声音的分类。以 MEEI 数据库中正常和病态嗓音信号为例,投像如图 4-10 所示,从投影得到的二维轨迹图可以看出,其二维图像仍保的基本形状和分类特征。
本文编号:3314313
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3314313.html