基于鼾声与血氧饱和度的睡眠呼吸状态监测方法研究
发布时间:2021-01-23 12:47
阻塞型睡眠呼吸暂停低通气综合症(Obstructive Sleep Apnea Hypopnea Syndrome,OSAHS)是一种常见的睡眠疾病,会导致患者夜间睡眠缺氧,严重影响了患者的睡眠质量和身体健康,因此对OSAHS的检测与诊断十分重要。目前检测OSAHS的金标准是多导睡眠监测,但多导睡眠监测检测费用较高,并且需要使用多根导联线连接患者,对患者睡眠造成影响。因此本文提出了一种基于概率集成回归模型的呼吸暂停低通气指数预测方法,以实现患者OSAHS检测。算法的成功实施可以极大地方便OSAHS疑似患者的检测,降低OSAHS对患者身体健康的威胁。首先,本文提出的OSAHS诊断方法的创新点在于将鼾声与血氧饱和度结合,利用OSAHS的特点,对血氧饱和度进行了预处理,采用中值滤波去除血氧饱和度中的噪声,依据血氧饱和度下降阈值执行下降段处理。根据血氧饱和度下降段对应的时间找到鼾声信号,利用梅尔倒谱系数进行特征提取,将特征输入到卷积神经网络中结合逻辑回归模型将下降段音频信号分类为鼾声、呼吸和噪声,并对处理后的鼾声与血氧饱和度进行特征提取。其次,通过对概率集成回归模型的原理、结构介绍,利用概率集...
【文章来源】:西安理工大学陕西省
【文章页数】:62 页
【学位级别】:硕士
【部分图文】:
PSG监测图
鼾声与血氧饱和度处理相关技术92鼾声与血氧饱和度处理相关技术2.1鼾声预处理相关理论概述鼾声预处理包括以下步骤:将音频信号利用梅尔倒谱系数进行声音识别,识别出来的声音进行卷积神经网络训练,通过逻辑回归模型将音频信号分为鼾声呼吸和噪声。首先梅尔倒谱系数(MelFrequencyCepstralCoefficents,MFCC)是一种能够自动识别语音说话的特征。针对人耳能够听到的声波不同,对声音做出的反应也不同,由于人耳内高音很容易被低音覆盖,因此低频声音处的高频声音要小很多,梅尔倒谱系数[47]是将低频到高频频带内进行带通滤波,使得输入的音频经过每个带通滤波器,输出音频或语音信号的基本特征。其次卷积神经网络(Convolutionalneuralnetworks,CNN)是应用最广泛的深度学习方法,尤其在图像识别领域取得了最先进的性能。近年来,CNN被应用于生物信号分类问题,如EEG,EOG,ECG。Haidar等人[48]提出了一种利用CNN检测呼吸暂停低通气事件的方法,在他们的方法中,评估了CNN在非重叠的30秒间隔内检测睡眠呼吸暂停事件的能力,但没有评估整个睡眠记录时间内的事件检测性能。卷积神经网络(CNN)是多层前馈神经网络的一个变体,通过一层层的堆叠形成多个层的网络,第一层为输入层,第一层的输出是下一层的输出,主要操作有三个,卷积,非线性和池化。最后利用逻辑回归模型对分类的可能性进行建模,预测出声音类别。本文中利用梅尔倒谱系数基于卷积神经网络结合逻辑回归模型,实现对鼾声音频信号的分类。通过对梅尔倒谱系数,卷积神经网络以及逻辑回归理解和利用,将音频信号分类为:鼾声,呼吸和噪声,音频信号处理流程如图2-1所示。图2-1音频信号处理Fig2-1Audiosignalprocessing
西安理工大学硕士学位论文12最后计算出每个滤波器组的对数能量:120()ln(|()|()),0NamksmXkHkmM==∑≤≤(2-6)再经离散余弦变换(DCT)得到MFCC系数:10(0.5)()()cos(),1,2,...,NmnmCnsmnLMπ==∑=(2-7)将对数能量代入离散余弦变换中,以获得L阶的梅尔倒谱系数。L阶是MFCC系数的阶,通常为12-16。M是三角形滤波器的数量,倒谱是对数信号的傅立叶变换的频谱,然后是傅立叶逆变换。此外,一帧的音量(即能量)也是音频的重要特征。因此,通常添加一帧的对数能量,即每帧信号的平方和,以10为底的对数乘以10,可以为每帧的基本音频特征增加一个维度,包括一个对数能量和其余倒谱参数[54]。综上所述,可得梅尔倒谱系数的流程:首先对音频信号进行预加重、分帧和加窗,加强音频信号的性能(信噪比,处理精度等等);其次对每个分析窗通过FFT得到对应的频谱,获得分布在时间轴上不同时间内的频谱,然后将频谱通过梅尔滤波器组得到梅尔频谱,通过梅尔频谱将线性的自然频谱转换为体现听觉特性的梅尔频谱[55];最后在梅尔频谱上进行倒谱分析,通过取对数,做逆变换取DCT后的第二到第13个系数作为梅尔倒谱系数,如图2-4所示为提取梅尔倒谱系数特征的过程。预加重、分帧和加窗FFT(FastFouriertransform)取绝对值或平方值梅尔滤波取对数DCT(Discretecosinetransform)动态特征输出处理后音频输入音频图2-4梅尔倒谱系数特征处理的过程Fig2-4MFCCfeatureprocessingprocess
本文编号:2995239
【文章来源】:西安理工大学陕西省
【文章页数】:62 页
【学位级别】:硕士
【部分图文】:
PSG监测图
鼾声与血氧饱和度处理相关技术92鼾声与血氧饱和度处理相关技术2.1鼾声预处理相关理论概述鼾声预处理包括以下步骤:将音频信号利用梅尔倒谱系数进行声音识别,识别出来的声音进行卷积神经网络训练,通过逻辑回归模型将音频信号分为鼾声呼吸和噪声。首先梅尔倒谱系数(MelFrequencyCepstralCoefficents,MFCC)是一种能够自动识别语音说话的特征。针对人耳能够听到的声波不同,对声音做出的反应也不同,由于人耳内高音很容易被低音覆盖,因此低频声音处的高频声音要小很多,梅尔倒谱系数[47]是将低频到高频频带内进行带通滤波,使得输入的音频经过每个带通滤波器,输出音频或语音信号的基本特征。其次卷积神经网络(Convolutionalneuralnetworks,CNN)是应用最广泛的深度学习方法,尤其在图像识别领域取得了最先进的性能。近年来,CNN被应用于生物信号分类问题,如EEG,EOG,ECG。Haidar等人[48]提出了一种利用CNN检测呼吸暂停低通气事件的方法,在他们的方法中,评估了CNN在非重叠的30秒间隔内检测睡眠呼吸暂停事件的能力,但没有评估整个睡眠记录时间内的事件检测性能。卷积神经网络(CNN)是多层前馈神经网络的一个变体,通过一层层的堆叠形成多个层的网络,第一层为输入层,第一层的输出是下一层的输出,主要操作有三个,卷积,非线性和池化。最后利用逻辑回归模型对分类的可能性进行建模,预测出声音类别。本文中利用梅尔倒谱系数基于卷积神经网络结合逻辑回归模型,实现对鼾声音频信号的分类。通过对梅尔倒谱系数,卷积神经网络以及逻辑回归理解和利用,将音频信号分类为:鼾声,呼吸和噪声,音频信号处理流程如图2-1所示。图2-1音频信号处理Fig2-1Audiosignalprocessing
西安理工大学硕士学位论文12最后计算出每个滤波器组的对数能量:120()ln(|()|()),0NamksmXkHkmM==∑≤≤(2-6)再经离散余弦变换(DCT)得到MFCC系数:10(0.5)()()cos(),1,2,...,NmnmCnsmnLMπ==∑=(2-7)将对数能量代入离散余弦变换中,以获得L阶的梅尔倒谱系数。L阶是MFCC系数的阶,通常为12-16。M是三角形滤波器的数量,倒谱是对数信号的傅立叶变换的频谱,然后是傅立叶逆变换。此外,一帧的音量(即能量)也是音频的重要特征。因此,通常添加一帧的对数能量,即每帧信号的平方和,以10为底的对数乘以10,可以为每帧的基本音频特征增加一个维度,包括一个对数能量和其余倒谱参数[54]。综上所述,可得梅尔倒谱系数的流程:首先对音频信号进行预加重、分帧和加窗,加强音频信号的性能(信噪比,处理精度等等);其次对每个分析窗通过FFT得到对应的频谱,获得分布在时间轴上不同时间内的频谱,然后将频谱通过梅尔滤波器组得到梅尔频谱,通过梅尔频谱将线性的自然频谱转换为体现听觉特性的梅尔频谱[55];最后在梅尔频谱上进行倒谱分析,通过取对数,做逆变换取DCT后的第二到第13个系数作为梅尔倒谱系数,如图2-4所示为提取梅尔倒谱系数特征的过程。预加重、分帧和加窗FFT(FastFouriertransform)取绝对值或平方值梅尔滤波取对数DCT(Discretecosinetransform)动态特征输出处理后音频输入音频图2-4梅尔倒谱系数特征处理的过程Fig2-4MFCCfeatureprocessingprocess
本文编号:2995239
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2995239.html