小波域多重分形和能量谱参数的病理嗓音识别研究
本文选题:病理嗓音识别 + 小波leaders多重分形 ; 参考:《苏州大学》2016年硕士论文
【摘要】:随着社会的发展,人们之间的交往日益频繁,语言是人与人交流的重要桥梁,但是嗓音疾病导致嗓音嘶哑、无力等,严重影响了人们的生活质量和社会交流。采用声学分析技术对病理嗓音信号进行研究和分析,可以实现对嗓音质量的客观评估,对喉部疾病的诊断和治疗具有重要意义。小波变换能在不同尺度对信号进行分析,多重分形谱能够精细刻画信号局部尺度行为,同时小波变换是一种时频分析方法,能有效反映嗓音在时间 尺度平面能量分布,因此本文主要研究了嗓音小波域多重分形谱参数和能量谱参数识别病理嗓音。针对单一分形维数在描述嗓音非线性方面的不足,引入分形和小波结合的小波leaders多重分形谱,并采用Chhabza算法求解小波leaders多重分形谱,通过非参数bootstrap统计估计参数置信区间。小波leaders多重分形谱能够表征嗓音信号的局部奇异性统计分布情况,其参数在正常嗓音和病理嗓音间具有较大差异,病理嗓音谱宽较小,正常嗓音谱宽较大,正常嗓音多重分形特征更加明显,小波leaders多重分形谱参数对病理嗓音的平均识别率为90.66%。传统声学参数无法很好的表征信号非平稳特性,本文对嗓音在小波域进行时频分析,提出一种小波域能量谱参数GCWT,对病理嗓音进行识别。对沿尺度轴方向的能量谱进行多维高斯混合建模,并且将模型参数作为嗓音特征参数GCWT进行病理嗓音识别,相对于传统参数,参数GCWT对病理嗓音具有比较好的识别效果,平均识别率为92.99%。由于参数GCWT维数较高,采用主成分分析和局部线性嵌入对特征参数GCWT进行降维处理,并且提出了动态加权局部线性嵌入DWLLE降维方法,弱化稀疏采样对降维的影响,有效保留了参数高维空间的几何特性,降低了参数冗余,降维后的参数对病理嗓音的识别率最高达97.45%。
[Abstract]:With the development of society, communication between people is becoming more and more frequent. Language is an important bridge between people, but voice diseases lead to hoarseness and powerlessness, which seriously affect people's quality of life and social communication. Using acoustic analysis technology to study and analyze pathological voice signals can realize the objective evaluation of voice quality and has important significance for the diagnosis and treatment of laryngeal diseases. Wavelet transform can analyze the signal at different scales, multifractal spectrum can describe the local scale behavior of the signal in detail, and wavelet transform is a time-frequency analysis method, which can effectively reflect the energy distribution of voice in time scale plane. In this paper, the multifractal and energy spectrum parameters of voice wavelet domain are studied to identify the pathological voice. Aiming at the shortage of single fractal dimension in describing voice nonlinearity, wavelet leaders multifractal spectrum combined with fractal and wavelet is introduced, and wavelet leaders multifractal spectrum is solved by Chhabza algorithm. Parameter confidence interval is estimated by nonparametric bootstrap statistics. Wavelet leaders multifractal spectrum can characterize the statistical distribution of local singularity of voice signal. The parameters of wavelet leaders multifractal spectrum are different between normal voice and pathological voice, the spectrum width of pathological voice is smaller, and the spectrum width of normal voice is larger. The multifractal feature of normal voice is more obvious, and the average recognition rate of wavelet leaders multifractal spectrum parameters for pathological voice is 90.66. The traditional acoustic parameters can not well characterize the non-stationary characteristics of the signal. In this paper, the time-frequency analysis of the voice in the wavelet domain is carried out, and a wavelet domain energy spectrum parameter GCWTis is proposed to identify the pathological voice. The multi-dimensional Gao Si hybrid modeling of energy spectrum along the scale axis is carried out, and the model parameters are used as the voice characteristic parameters to identify the pathological voice. Compared with the traditional parameters, the parameter Gao Si has a better recognition effect on the pathological voice. The average recognition rate was 92.99%. Due to the high dimension of parameter GCWT, the dimensionality reduction of characteristic parameter GCWT is performed by principal component analysis and local linear embedding, and a dynamic weighted locally linear embedding DWLLE method is proposed to reduce the dimension, which weakens the effect of sparse sampling on dimensionality reduction. The geometric characteristics of the high-dimensional space are effectively preserved and the redundancy of the parameters is reduced. The recognition rate of the parameters after dimensionality reduction is 97.45%.
【学位授予单位】:苏州大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:R767.92
【相似文献】
相关期刊论文 前8条
1 黄海英,黄建波,李志尊;多重分形在旋转机械故障诊断中的应用[J];现代制造工程;2004年09期
2 余正锋;王俊;;早搏信号的小波模极大多重分形分析[J];生物医学工程学杂志;2011年05期
3 王坚;田社平;颜国正;;结肠道压力数据的多重分形分析及熵解释[J];中国生物医学工程学报;2008年04期
4 王俊,宁新宝,陈颖;同步12导联ECG的多重分形分布[J];南京大学学报(自然科学版);2004年01期
5 陈颖;Martyn P.Nash;宁新宝;王业琳;David J.Paterson;王俊;;缺血时三维心室外膜Map多重分形的变化[J];科学通报;2005年22期
6 唐芳;薛付忠;王洁贞;康殿民;王志强;胡平;张玉军;;疾病空间分布的“等值线-面积”多重分形模型及其应用[J];山东大学学报(医学版);2006年11期
7 王坚;田社平;颜国正;;结肠道压力数据的多重分形分析[J];中国计量学院学报;2005年04期
8 ;[J];;年期
相关会议论文 前10条
1 宁新宝;王俊;;生理信号中的多重分形[A];中国生物医学工程学会第六次会员代表大会暨学术会议论文摘要汇编[C];2004年
2 谢淑云;鲍征宇;;地球化学场的分形与多重分形特征[A];中国矿物岩石地球化学学会第九届学术年会论文摘要集[C];2003年
3 林勇;赵国庆;喻祖国;;多重分形分析在经济中的应用[A];2002年中国管理科学学术会议论文集[C];2002年
4 那木吉拉;陈志军;;戈壁覆盖区遥感信息提取阈值确定的多重分形方法探讨[A];第十二届全国数学地质与地学信息学术研讨会论文集[C];2013年
5 谢平;刘彬;王霄;林洪彬;;多重分形熵及其在非平稳信号分析中的应用研究[A];第七届青年学术会议论文集[C];2005年
6 郑婷婷;毛军军;吴涛;宋杰;;多重分形和商空间理论在蛋白质结构类分析中的应用[A];第二十六届中国控制会议论文集[C];2007年
7 蒋志强;周炜星;;中国证券市场的多重分形特征[A];中国数学力学物理学高新技术交叉研究学会第十二届学术年会论文集[C];2008年
8 吴飞;王翠香;;随机数的几种产生方法及其在多重分形模型中的应用研究[A];中国地球物理第二十一届年会论文集[C];2005年
9 曹广喜;史安娜;;上海股市收益的多重分形特征的实证研究:一种新的MFDFA方法[A];第八届中国管理科学学术年会论文集[C];2006年
10 张颖;路影;;时尚商品价格时间序列的多重分形分析[A];2007中国控制与决策学术年会论文集[C];2007年
相关博士学位论文 前10条
1 倪黄晶;人脑磁共振数据的多重分形研究[D];南京大学;2015年
2 范一飞;基于分形和多重分形的海面微弱目标检测方法研究[D];西安电子科技大学;2016年
3 谢淑云;地球化学场的分形与多重分形特征[D];中国地质大学;2003年
4 苑宝;多重分形理论及其在中国股票市场中的应用研究[D];东北大学;2007年
5 李大辉;网络视频流量的多重分形建模与多步预测研究[D];哈尔滨工程大学;2012年
6 王访;作物诊断的叶片图像多重分形方法与建模[D];湖南农业大学;2013年
7 陈洪涛;石油期货市场多重分形特征及相关问题研究[D];南京航空航天大学;2009年
8 高歆;基于小波变换的二维地球化学景观多重分形建模[D];中国地质大学(北京);2010年
9 于雷;基于多重分形频谱技术的木材CT检测及其三维结构重建[D];东北林业大学;2010年
10 陈存;材料压缩变形中的数学问题研究[D];郑州大学;2015年
相关硕士学位论文 前10条
1 邓强强;基于Agent的股市建模与市场分形特征研究[D];南京信息工程大学;2015年
2 韩彦;中国境内外股市间的多重分形交叉相关性研究[D];南京信息工程大学;2015年
3 郭凌俐;黄土区露天煤矿排土场重构土壤孔隙分布的多重分形表征[D];中国地质大学(北京);2015年
4 雷玺;多重分形在海洋波高数据分析中的应用[D];中国海洋大学;2015年
5 颜天晓;基于多重分形与灰色模型的渐开线圆柱齿轮接触寿命预测[D];太原理工大学;2016年
6 廖建栋;新疆惠井子南山地球化学异常信息的识别与综合评价[D];西北师范大学;2015年
7 侯捷;多重分形在时间序列中的几个应用[D];江苏大学;2016年
8 陈艳茹;多重分形视角下中国股市波动建模研究[D];福州大学;2014年
9 常静雅;小波域多重分形和能量谱参数的病理嗓音识别研究[D];苏州大学;2016年
10 洪维嘉;POTTS模型的非线性金融系统及统计分析[D];北京交通大学;2016年
,本文编号:2054849
本文链接:https://www.wllwen.com/yixuelunwen/wuguanyixuelunwen/2054849.html