基于语音特征学习的说话人确认与帕金森诊断
本文关键词:基于语音特征学习的说话人确认与帕金森诊断,,由笔耕文化传播整理发布。
【摘要】:语音特征是一种重要的生物标记物,已经广泛用于说话人识别、疾病诊断等领域。其中,说话人确认与帕金森疾病诊断是语音特征近年来应用研究的热点和难点。虽然相关研究取得了许多正面的进展,极大的显示了其应用潜力,但在特征压缩、样本优选、分类器优化等方面,还存在一定的问题,而这些方面都是提高语音特征学习质量的重要环节。基于此,本文在相关课题资助下,针对说话人确认和帕金森疾病诊断这两个具体应用问题,研究了其语音特征压缩、样本优选、分类器优化等环节,提出了三种改进算法,实现了识别性能的提高。相关主要工作如下:(1)提出了一种多类型语音特征封装式进化特征选择框架算法,同时,基于该框架算法,给出了一种具体的实现方式—四类型语音特征封装式遗传特征选择算法,为该框架算法给出了具体实现范例。本框架算法的提出,有利于解决目前缺乏相关方法标准化框架研究的问题。(2)提出了一种极低信噪比环境下基于多类型语音特征学习的说话人确认算法。首先设计了低信噪比下提取多种类型语音特征的方法,尤其是引入了基音频率提取算法。然后设计了基于CAGA和GMM-UBM的特征选择分类集成模型,通过对提取的特征进行选择实现融合,用于说话人确认。本算法的提出实现了面向极低信噪比环境下的说话人确认算法,有助于解决在这一应用领域中存在的语音提取质量低的问题。(3)提出了基于语音样本重复剪辑算法和随机森林的帕金森症诊断算法,通过样本重复剪辑算法实现对语音样本的优选,通过引入随机森林实现对样本的集成学习。该算法实现了对语音样本的优选,提高了样本的质量,将为目前基于语音的帕金森症诊断研究提供新的研究思路和方法参考。本文为相关研究者提供了方法参考,为提高基于语音特征学习的模式分类研究提供了新的思路,具有重要的研究意义。
【关键词】:说话人确认 特征选择 极低信噪比 帕金森疾病诊断 重复剪辑近邻算法
【学位授予单位】:重庆大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:R742.5;TN912.3
【目录】:
- 摘要3-4
- ABSTRACT4-8
- 1 绪论8-14
- 1.1 引言8-9
- 1.2 国内外研究现状9-12
- 1.3 本文的主要内容12
- 1.4 本文文章结构12-14
- 2 本文算法基本原理14-32
- 2.1 语音信号的预处理15-17
- 2.1.1 预加重15-16
- 2.1.2 端点检测(VAD)16
- 2.1.3 分帧与加窗16-17
- 2.2 语音信号的特征参数提取17-22
- 2.2.1 线性预测倒谱系数(LPCC)18-19
- 2.2.2 梅尔频率倒谱系数(MFCC)19-21
- 2.2.3 MFCC中加入能量信息和动态参数21-22
- 2.3 分类器22-28
- 2.3.1 高斯混合模型-通用背景模型(GMM-UBM)22-26
- 2.3.2 支持向量机26-27
- 2.3.3 随机森林27-28
- 2.4 算法性能评价标准28-31
- 2.4.1 等错率29
- 2.4.2 DET曲线29-30
- 2.4.3 检测代价函数(DCF)30-31
- 2.4.4 帕金森诊断实验评价指标31
- 2.5 本章小结31-32
- 3 多类型语音特征的封装式进化选择框架算法研究32-48
- 3.1 FSF-WRGAF算法语音特征提取模块—GFCC参数提取33-36
- 3.2 链式智能体遗传算法(CAGA)36-39
- 3.3 FSF-WRGAF算法封装式语音特征选择模块39-41
- 3.4 实验结果与分析41-46
- 3.4.1 实验条件41-42
- 3.4.2 提取的特征类型分析42-44
- 3.4.3 FSF-WrGAF算法选择的语音特征性能分析44
- 3.4.4 相关算法的识别性能比较44-46
- 3.4.5 噪声下相关语音特征参数的识别性能比较46
- 3.5 本章小结46-48
- 4 极低信噪比下多类型特征学习用于说话人确认48-54
- 4.1 极低信噪比噪声下基于DP的基音频率提取(DP_PEFAC算法)49-51
- 4.2 实验结果与分析51-53
- 4.2.1 实验条件52
- 4.2.2 极低信噪比下识别性能比较52-53
- 4.3 本章小结53-54
- 5 基于语音样本重复剪辑和随机森林的帕金森症辅助诊断算法研究54-68
- 5.1 语音数据特征提取54-58
- 5.2 样本重复剪辑近邻算法58-59
- 5.3 实验结果与分析59-66
- 5.3.1 实验条件59-60
- 5.3.2 本文算法分类结果与分析60-61
- 5.3.3 语音样本优选效果与分析61-64
- 5.3.4 分类平稳性比较分析64-65
- 5.3.5 分类算法的显著性差异分析65-66
- 5.4 结论66-68
- 6 总结与展望68-70
- 6.1 总结68-69
- 6.2 展望69-70
- 致谢70-72
- 参考文献72-78
- 附录78
- A. 作者在攻读学位期间取得的科研成果78
- B. 作者在攻读学位期间参与的科研项目78
【相似文献】
中国重要会议论文全文数据库 前10条
1 吴玺宏;迟惠生;;一种高性能的限定文本说话人确认系统[A];第三届全国人机语音通讯学术会议论文集[C];1994年
2 洪青阳;陈毅东;;一种用于说话人确认的区别性训练方法[A];第八届全国人机语音通讯学术会议论文集[C];2005年
3 许云飞;黄厚军;金怡珠;李桂莲;周若华;;基于PLDA的“一对多”下的说话人确认方法研究[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年
4 展领;景新幸;;矢量量化和VQ-UBM在说话人确认中的应用[A];中国声学学会2009年青年学术会议[CYCA’09]论文集[C];2009年
5 赵贤宇;董远;张雪峰;杨浩;王海拉;;说话人确认系统中基于高斯混合分布相似度选择TNorm背景模型的研究[A];第八届全国人机语音通讯学术会议论文集[C];2005年
6 赵亚丽;付中华;谢磊;张健;张艳宁;;双麦克风语音增强和杂混模型训练相结合的顽健说话人确认[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
7 杨艺敏;景新幸;杨海燕;;PSO-SVM在说话人确认系统中的研究[A];泛在信息社会中的声学——中国声学学会2010年全国会员代表大会暨学术会议论文集[C];2010年
8 张涛;王岚;迟惠生;;基于VQ的说话人确认系统的硬件实现[A];第六届全国人机语音通讯学术会议论文集[C];2001年
9 尹聪;白静;龚[
本文编号:490836
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/490836.html