基于频谱上下文的语音识别及情感分类算法研究
发布时间:2020-04-10 17:55
【摘要】:语音识别系统经过多年的发展已经在很多场合取得了良好的应用效果,但是普及程度并不理想。特定环境下搭建的语音识别系统,在实际复杂应用场景中往往很难实现有效的识别结果。由于背景噪声干扰、说话人情绪变化以及信道畸变等因素的影响,使得实验室环境下训练好的语音识别系统在实际应用中性能急剧恶化,难以达到令人满意的结果。本文根据语音识别及情感分类中一些关键步骤和上述研究现状及难点,着重对噪声干扰和情绪变化下的语音识别系统进行研究。主要内容包括:逡逡逡(1)提出一种基于上下文特征描述符的特征提取方法。在噪声环境下以及不同情感环境中,传统语音特征难以提供有效的动态信息。因此,本文构建出一种频谱序列的上下文(SSC)的特征方法,对比传统的动态信息处理方式,系统性能有显著的提高,在噪声环境及语音情感识别中都取得了良好的效果。而且在其他频谱过程中都可引入此特征,方法具有一定的普适性。(2)研究噪声环境下的语音识别,提出一种基于递归图压缩距离的语音识别算法。语音信号作为一个随时间变化的序列,通过研究递归图模型在时间序列中的显著作用,将语音特征序列进行递归图压缩,利用MPEG-1压缩算法计算不同递归图之间的CK-1距离,完成整个语音识别过程。(3)研究情绪变化中的分类决策,提出一种基于多特征深度置信网络的语音情感识别算法。针对不同特征对情感描述能力的不同,我们提取多种鲁棒的低级特征,然后将其馈入DBN网络中提取高层特征描述符,进而采用集成学习的思想,对ELM分类结果投票融合,在三种公开数据集上证明了本文算法的有效性。
【图文】:
为语音识别技术在现实生活中的应用场景。语音信号输入图1 语音识别应用场景实例在上图中,我们可以通过语音与控制系统之间的交互,展现智能化流程。例如通过对语音输入设备发送“开电视”,即可打开电视;发送“关灯”,即可关闭电灯,这些通过语音识别技术来控制智能家居的模式已经走进了我们的生活。并且在你回家后,系统会根据你当天的心情的变化,,自动调节家中灯光的亮度,以及播放不同音乐,心情高兴时,亮度高,播放一些欢快的音乐;心情沮丧时,调低亮度,自动播放一些舒缓的轻音乐。这些应用的出现在一定程度上赋予了机器以人的感知,使得机器与人之间的交流成为可能, 这也就决定了语音识别技术在人机交互中的重要作用
4(a)原始语音信号 (b)加噪语音信号图2 噪声环境下语音信号波形对比图(a)“中性”情感信号 (b)“害怕”情感信号图3 不同情感语音信号波形对比图语音信号处理的研究由来已久,早在上个世纪五十年代就已经展开了语音识别的研究,Audry 在 Bell 实验室的开发成功拉开了人类对语音识别领域研究的大幕。早期的方法大多是利用模拟电路来实现的测试语音与参考模板之间的运算关系,通过硬件电路对其结果的判定来实现语音识别的整个过程。随着语音识别技术取得从 0 到 1 的突破之后,后续的研究者做了诸多的探索与研究,在前人的基础上也提出了一些有效的识别算法,加速了语音识别的发展。Zahorian、Nossair 等[25]提出利用语音信号的非线性频率、幅值等特征来表示信号的瞬时特性,利用模式识别的方法进行模板匹配取得了良好的识别效果。Chengalvarayan、Deng 等[26]针对语音信号的序列在特征提取后,向量的维度随着序列长度的增加而大幅增高,提出一种降低特征向量维度的特征提取算法。经过多年的积累
【学位授予单位】:西北大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TN912.34
本文编号:2622538
【图文】:
为语音识别技术在现实生活中的应用场景。语音信号输入图1 语音识别应用场景实例在上图中,我们可以通过语音与控制系统之间的交互,展现智能化流程。例如通过对语音输入设备发送“开电视”,即可打开电视;发送“关灯”,即可关闭电灯,这些通过语音识别技术来控制智能家居的模式已经走进了我们的生活。并且在你回家后,系统会根据你当天的心情的变化,,自动调节家中灯光的亮度,以及播放不同音乐,心情高兴时,亮度高,播放一些欢快的音乐;心情沮丧时,调低亮度,自动播放一些舒缓的轻音乐。这些应用的出现在一定程度上赋予了机器以人的感知,使得机器与人之间的交流成为可能, 这也就决定了语音识别技术在人机交互中的重要作用
4(a)原始语音信号 (b)加噪语音信号图2 噪声环境下语音信号波形对比图(a)“中性”情感信号 (b)“害怕”情感信号图3 不同情感语音信号波形对比图语音信号处理的研究由来已久,早在上个世纪五十年代就已经展开了语音识别的研究,Audry 在 Bell 实验室的开发成功拉开了人类对语音识别领域研究的大幕。早期的方法大多是利用模拟电路来实现的测试语音与参考模板之间的运算关系,通过硬件电路对其结果的判定来实现语音识别的整个过程。随着语音识别技术取得从 0 到 1 的突破之后,后续的研究者做了诸多的探索与研究,在前人的基础上也提出了一些有效的识别算法,加速了语音识别的发展。Zahorian、Nossair 等[25]提出利用语音信号的非线性频率、幅值等特征来表示信号的瞬时特性,利用模式识别的方法进行模板匹配取得了良好的识别效果。Chengalvarayan、Deng 等[26]针对语音信号的序列在特征提取后,向量的维度随着序列长度的增加而大幅增高,提出一种降低特征向量维度的特征提取算法。经过多年的积累
【学位授予单位】:西北大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TN912.34
【参考文献】
相关期刊论文 前2条
1 徐子豪;张腾飞;;基于语音识别和无线传感网络的智能家居系统设计[J];计算机测量与控制;2012年01期
2 卢志茂;金辉;张春祥;任明溪;;基于HHT和OSF的复杂环境语音端点检测[J];电子与信息学报;2012年01期
相关博士学位论文 前2条
1 孙亚新;语音情感识别中的特征提取与识别算法研究[D];华南理工大学;2015年
2 周盼;基于深层神经网络的语音识别声学建模研究[D];中国科学技术大学;2014年
本文编号:2622538
本文链接:https://www.wllwen.com/kejilunwen/wltx/2622538.html