传统声学特征和非线性特征用于病态嗓音的比较研究
本文关键词: 病态嗓音 支持向量机 传统声学特征 非线性动力学技术 出处:《生物医学工程学杂志》2014年05期 论文类型:期刊论文
【摘要】:本文通过分析嗓音的发音机制,提取正常与病态嗓音的传统声学参数[基频、Mel倒谱系数(MFCC)、线性预测系数(LPCC)、频率微扰、振幅微扰]与非线性动力学特征参数[熵(样本熵、模糊熵、多尺度熵)、计盒维数、计维截距和Hurst参数],作为病态嗓音识别的特征矢量集。应用支持向量机(SVM)对/a/音的78例正常嗓音与73例病态嗓音和/i/音的78例正常嗓音与80例病态嗓音进行建模与识别。结果表明,相对于传统的声学特征参数,非线性特征参数能更好地区分正常与病态嗓音;实验提取的所有参数中,除了多尺度熵,/a/音的正常与病态嗓音的识别率均高于/i/音,因此为了达到识别病态嗓音的目的,国内外相关研究大多采用/a/音数据;多尺度熵特征对/i/音的正常与病态嗓音的识别率较/a/音高,它或能为评价声带代偿功能状态的研究提供有益的启发。
[Abstract]:By analyzing the phonetic mechanism of voice, the traditional acoustic parameters (fundamental frequency Mel cepstrum coefficient MFCCP, linear prediction coefficient LPCCX, frequency perturbation, amplitude perturbation) and nonlinear dynamic characteristic parameter [entropy, sample entropy,] are extracted. Fuzzy entropy, multi-scale entropy, box-counting dimension, Dimension intercept and Hurst parameter], as feature vector set for pathological voice recognition. Using support Vector Machine (SVM) to model 78 normal voices of / R / A, 78 normal voices of 73 pathological voices and 78 normal voices and 80 sick voices of / R / A voice. And recognition. The results show that, Compared with the traditional acoustic characteristic parameters, the nonlinear characteristic parameters can better distinguish the normal voice from the pathological voice, except for the multi-scale entropy / a / sound, the recognition rate of the normal voice and the pathological voice is higher than that of the / I / sound. Therefore, in order to identify the pathological voice, most of the related studies at home and abroad adopt the / R / A / sound data, and the recognition rate of the normal / pathological voice of the / I / sound is higher than that of the / R / R, It may provide useful inspiration for the evaluation of vocal compensatory functional state.
【作者单位】: 广西师范大学电子工程学院;
【基金】:国家自然科学基金资助项目(61362003) 广西自然科学基金资助项目(2010GXNSFA013128)
【分类号】:R312
【参考文献】
相关期刊论文 前9条
1 高俊芬;胡维平;;基于非线性动力学和GMM的病态嗓音识别与研究[J];广西师范大学学报(自然科学版);2011年03期
2 王修信,梁冬冬,胡维平,姚铁钧;频率微扰商在正常与病态嗓音声谱分析中的应用[J];广西师范大学学报(自然科学版);1998年04期
3 胡维平,王修信,曾恩思,梁冬冬;噪音频域分析中的特征研究[J];广西物理;1998年01期
4 龚英姬;胡维平;;基于HHT变换的病态嗓音特征提取及识别研究[J];计算机工程与应用;2007年34期
5 于燕平;胡维平;;病态嗓音特征的小波变换提取及识别研究[J];计算机工程与应用;2009年22期
6 毛大伟;曹华;木拉提.哈米提;童勤业;;基于美尔倒谱系数和复杂性的说话人识别[J];生物医学工程学杂志;2006年04期
7 焦青;郭永新;张正国;;混沌与分形及其在心电信号研究中的应用[J];生物医学工程学杂志;2009年03期
8 高俊芬;胡维平;;基于非线性动力学和高斯混合模型/支持向量机的病态嗓音识别与研究[J];生物医学工程学杂志;2012年04期
9 邹晓阳;雷敏;;基于多尺度模糊熵的动作表面肌电信号模式识别[J];生物医学工程学杂志;2012年06期
【共引文献】
相关期刊论文 前10条
1 高俊芬;胡维平;;基于非线性动力学和GMM的病态嗓音识别与研究[J];广西师范大学学报(自然科学版);2011年03期
2 陈婷;敖茂尧;陈贺璋;;基于Mel系数和SVM的语音识别技术研究[J];广西职业技术学院学报;2010年05期
3 孙克辉;贺少波;朱从旭;何毅;;基于C_0算法的混沌系统复杂度特性分析[J];电子学报;2013年09期
4 于燕平;胡维平;;病态嗓音特征的小波变换提取及识别研究[J];计算机工程与应用;2009年22期
5 陈承义;高俊芬;;病态嗓音的识别与研究[J];计算机工程与应用;2013年07期
6 傅春;董峰;谭超;;基于多尺度谱熵的气液两相流型动力学特性分析[J];计算机与应用化学;2014年01期
7 刘志刚;杨荣菲;向宏辉;;基于模糊熵的压气机失速信号分析研究[J];测控技术;2014年02期
8 秦娜;金炜东;黄进;李智敏;;高速列车转向架故障信号的聚合经验模态分解和模糊熵特征分析[J];控制理论与应用;2014年09期
9 高俊芬;胡维平;;基于非线性动力学和高斯混合模型/支持向量机的病态嗓音识别与研究[J];生物医学工程学杂志;2012年04期
10 张华;李忠海;王文龙;赵义;;基于Hilbert-Huang算法的缺时检测问题的研究[J];沈阳师范大学学报(自然科学版);2013年01期
相关会议论文 前1条
1 石伟;邹月娴;;低信噪比下基于HHT的语音端点检测算法[A];中国声学学会第九届青年学术会议论文集[C];2011年
相关博士学位论文 前5条
1 翟军鹏;基于心率变异性非线性分析的冠心病中医证候研究[D];中国中医科学院;2012年
2 成娟;基于表面肌电和加速度信号融合的动作识别和人体行为分析研究[D];中国科学技术大学;2013年
3 李宁;基于声学参数和支持向量机的病理嗓音分类研究[D];华东师范大学;2013年
4 李鹏;基于熵测度的短时心脏动力学分析[D];山东大学;2014年
5 张引红;非线性鼾音信号时频特征分析研究[D];陕西师范大学;2014年
相关硕士学位论文 前10条
1 韦丽兴;采用脉冲耦合神经网络的有噪特定人语音识别系统研究[D];广东工业大学;2011年
2 卢宪金;基于VC++6.0的说话人识别系统的研究[D];辽宁大学;2011年
3 沈志远;希尔伯特——黄变换算法与应用研究[D];哈尔滨工业大学;2010年
4 陈涛;基于人脸和语音的PFV-ATM系统的实现[D];浙江大学;2008年
5 骆瑞玲;基于SVM的与文本无关的说话人识别算法研究[D];兰州理工大学;2009年
6 邢玉娟;说话人特征提取和识别算法的研究[D];兰州理工大学;2009年
7 高俊芬;基于非线性动力学及GMM/SVM病态嗓音识别与研究[D];广西师范大学;2012年
8 张月;负熵最大化的FastICA心电消噪研究[D];太原理工大学;2012年
9 付浩楠;声纹识别在声控系统中的研究与实现[D];黑龙江大学;2012年
10 王宏宇;基于希尔伯特—黄变换的语音识别特征提取方法研究[D];华南理工大学;2012年
【二级参考文献】
相关期刊论文 前10条
1 吴淑珍,吴阿华;说话人识别的参量研究和语音库建设[J];北京大学学报(自然科学版);1995年03期
2 胡光锐,韦晓东;基于倒谱特征的带噪语音端点检测[J];电子学报;2000年10期
3 韦岗,,陆以勤,欧阳景正;混沌、分形理论与语音信号处理[J];电子学报;1996年01期
4 何平;杨式麟;;关于胸声、假声研究的概况[J];国外医学.耳鼻咽喉科学分册;1993年05期
5 韩仲明;嗓音疾病的临床检测[J];国外医学(耳鼻咽喉科学分册);1998年05期
6 Kahane JC;汤建国;;嗓音医学进展[J];国外医学.耳鼻咽喉科学分册;1989年05期
7 李敏丹,张宏,童勤业;基于复杂性的说话人识别技术探讨[J];航天医学与医学工程;2003年03期
8 刘加海;王丽;王健;;基于相空间、熵和复杂度变化的表面肌电信号分析[J];浙江大学学报(理学版);2006年02期
9 龚英姬;胡维平;;基于HHT变换的病态嗓音特征提取及识别研究[J];计算机工程与应用;2007年34期
10 于燕平;胡维平;;病态嗓音特征的小波变换提取及识别研究[J];计算机工程与应用;2009年22期
【相似文献】
相关期刊论文 前10条
1 王双乐,周涛,何佳莉,杨强,常伟;成人嗓音计算机检测及分析[J];临床耳鼻咽喉科杂志;1998年10期
2 刘永泽;胆囊息肉的声学诊断与动态观察[J];中国超声医学杂志;1992年S1期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
相关会议论文 前10条
1 吴洁敏;;汉语基调的二维九宫矩阵及其声学参数(论文提要)[A];第五届全国人机语音通讯学术会议论文集[C];1998年
2 缪冠琼;郝玉峰;吕士楠;;普通话辅音[r]的声学特征研究[A];第九届全国人机语音通讯学术会议论文集[C];2007年
3 朱强华;郑铁然;韩纪庆;;行车环境下基于二值语谱图的声学事件检测[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年
4 姚友群;邵鹏飞;周卫京;;小学六年级学生单元音习得的声学特征[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年
5 郑日新;;耳鸣声学特征与中医证型相关性的初步研究[A];中华中医药学会耳鼻咽喉科分会第十二次学术研讨会暨嗓音言语听力医学专题学术研讨会论文集[C];2005年
6 俞振利;王开志;祖漪清;岳东剑;陈贵林;;基于音节信号声学特征的中文TTS系统中拼接单元的挑选方法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
7 张皖志;陶建华;;基于声韵母基元声学特征的中文TTS系统中音库的量化压缩策略[A];第八届全国人机语音通讯学术会议论文集[C];2005年
8 崔效义;李敬阳;王莉;;采样率对共振峰等声学特征提取的影响[A];第六届全国现代语音学学术会议论文集(下)[C];2003年
9 张祺;;密堆颗粒固体在直剪作用下的声学特征[A];第七届全国液体和软物质物理学术会议程序册及论文摘要集[C];2010年
10 张家
本文编号:1552037
本文链接:https://www.wllwen.com/yixuelunwen/swyx/1552037.html