基于声诊的疾病分类树构建
发布时间:2021-03-05 03:53
随着计算机技术逐渐应用于医学领域中,借助计算机对患者的嗓音进行分析和诊断,成本低且易操作。由于声诊具有简便快捷、无损伤无痛等优势,越来越多的研究者开始关注相关的研究。影响发声的疾病主要包括神经类、肺病类和发声器官病变类,本文针对三大类疾病中的典型疾病,通过分析病态嗓音与健康嗓音间的差异性,从特征提取、特征选择和特征融合展开不同类别嗓音间的二分类研究,将多分类问题分解为二分类问题,构建基于声诊的疾病分类树模型。首先,通过分析病态嗓音与健康嗓音的差异性,提取了基于先验知识和基于字典学习的嗓音特征。针对各类别间嗓音样本数量不平衡的问题,分别设计了健康样本和肺癌样本的下采样、上采样方案,实验结果证明本文中提出方法有效缓解了样本不平衡导致的少数类样本误分问题。然后,针对提取的嗓音特征维数过高的问题,采用特征选择的方式消除冗余特征,选择最佳的特征子集,在保证分类精度的基础上有效降低了特征维数。在单发音特征优化的基础上,分析不同发音在各类别间二分类的差异性,提出了特征层和决策层的多发音融合方案,充分利用不同发音的特征信息,有效提升了分类的准确率。最后,针对多分类中少数类样本分类精度低的问题,将多分类...
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
各类别Mel倒谱系数图
图 2-3 各类别嗓音样本波形图本文使用的疾病语音数据库通过与广东省中医院合作采集,采用标准化流程,具有医生诊断的真实标签。数据库中包含健康与多种类别疾病的本,每例样本都包含同一采集人对不同内容的持续发音,每个录音持续,在此选取每例样本都包含的/l /、/wō/、/l /、/yī/四种发音样本,各类样本数量如表 2-2 中所示。表 2-2 各类别样本数量类别 数量健康 446 例帕金森 122 例感冒 100 例肺癌 30 例 实验结果以及分析由于各类别样本间数量的不平衡问题,因此只通过准确率对分类效果进
本文编号:3064528
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
各类别Mel倒谱系数图
图 2-3 各类别嗓音样本波形图本文使用的疾病语音数据库通过与广东省中医院合作采集,采用标准化流程,具有医生诊断的真实标签。数据库中包含健康与多种类别疾病的本,每例样本都包含同一采集人对不同内容的持续发音,每个录音持续,在此选取每例样本都包含的/l /、/wō/、/l /、/yī/四种发音样本,各类样本数量如表 2-2 中所示。表 2-2 各类别样本数量类别 数量健康 446 例帕金森 122 例感冒 100 例肺癌 30 例 实验结果以及分析由于各类别样本间数量的不平衡问题,因此只通过准确率对分类效果进
本文编号:3064528
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3064528.html