当前位置:主页 > 科技论文 > 信息工程论文 >

基于稀疏度量的多级FrFT语音增强算法研究

发布时间:2021-06-07 21:40
  一直以来,语音就是人与人之间日常交流的主要载体。随着现代计算机技术和人工智能技术的快速发展,语音逐渐成为人机交互的重要形式。但是周围环境的噪声一直干扰语音信号,语音的质量和可懂度大大降低,严重影响人们的生活质量和人机交互质量。语音增强技术的本质就是采取某种算法尽可能地消除语音中的噪声,提高语音的清晰度和可懂度。传统的语音增强算法在平稳噪声环境中具有良好的去噪效果,但是在非平稳噪声环境中,这些传统方法的去噪效果并不明显,甚至在去除噪声的同时削弱语音的质量,使得语音严重失真。本文分析了传统变换域语音增强算法,发现在非平稳噪声环境下,传统变换域中重叠的语音信号和噪声无法完全分离的问题,基于此本文提出了基于稀疏度的多级分数阶傅里叶变换(Fractional Fourier Transform,FrFT)语音增强算法,主要研究内容和创新点有:(1)分数阶变换域稀疏度量研究。研究了语音信号和噪声在分数阶傅里叶变换域的能量分布,发现语音信号在分数阶域具有较强的能量聚集性。充分研究传统的变换阶数确定方法,即最小均方误差法和最大信噪比法,这些方法计算量较大,不适于实际应用。基于语音信号在分数阶域的稀疏特... 

【文章来源】:青岛大学山东省

【文章页数】:63 页

【学位级别】:硕士

【部分图文】:

基于稀疏度量的多级FrFT语音增强算法研究


文章主要结构框图

原理模型,器官,声带,声道


第二章语音增强概述5第二章语音增强概述2.1语音特性2.1.1语音产生原理在大脑的控制下,人的发声器官会经过一系列的生理运动,便产生了语音。人的发声器官主要有三部分:(1)气源:肺和气管产生;(2)声门:喉和声带组成;(3)声道:咽腔、口腔和鼻腔组成[19],发声器官示意图如图2.1。图2.1发声器官原理模型吸入的空气首先会经过声带,从肺部进入声道,然后从嘴中辐射出声波,便形成了语音。“声门子系统”在声门的左边,可以产生激励振动,而“声道系统”和“辐射系统”在声门的右边[20]。在发出不同的语音时,激励振动和声带的状态是不同的,对应的模型也不相同[19]。当空气流经过声带时,如果声带是紧绷的,声带将会周期性地张开和闭合。声带开启,空气流从声门辐射出来,产生一个脉冲;声带闭合,则相当于脉冲序列的间隙期。随着声带周期性地开启和闭合便产生了具有周期特性的浊音。当空气流经过声带时,如果声带是舒展开的,空气流会直接通过声门,此时会有两种不同的情况:(1)若声道中的某个部位收缩,形成一个狭窄的通道,空气流便会高速通过收缩区,并产生空气湍流,空气湍流经过声道后就形成摩擦音或者清音;(2)若声道中的某个部位处于闭合状态,空气流到达声道时形成空气压力[21],空气压力会在闭合部位突然开启时冲出声道,便形成爆破音。这两种情况下产生的语音均为清音。

语音,激励模型,信号


青岛大学硕士学位论文62.1.2语音信号数字模型在实际的研究过程中,非常必要的前提就是构建语音信号的数字模型。语音的数字模型根据发声原理构建而成,主要包括激励模型,声道模型和辐射模型。模型原理图如图2.2所示。图2.2语音信号产生的激励模型语音信号数字模型的传递函数为:HAzGzzzRV2-(1)式中,A为振幅,G(z)为激励函数,V(z)为声道传输函数,R(z)为辐射函数。2.1.3语音特性语音是由人的声带振动产生的,声带振动的频率在很大程度上决定了语音的一些特殊性质,语音特性主要包括以下三部分:(1)短时平稳性根据语音的产生原理,可以得出语音的生成过程是非平稳的、时变的。但在一个相对较短的时间内,发声器官是相对平稳的,所以语音信号可以看做是短时平稳的,一般在10ms-30ms之间语音特性是基本不变的[22]。在短时间内,语音信号的频谱也是平稳不变的。在语音信号处理时,可利用语音的短时平稳性对语音信号分帧,从而对语音信号做短时处理[23]。(2)清音和浊音根据语音的发声原理,当空气流经过声带时,声带振动则产生浊音,声带不振动则产生清音。浊音和清音的特性具有较大的差异,在时域上,浊音的波形具有明

【参考文献】:
期刊论文
[1]基于FrFT的自适应阈值语音滤波降噪研究[J]. 范珍艳,王莲子,庄晓东.  青岛大学学报(工程技术版). 2019(04)
[2]分数傅里叶变换理论及其应用研究进展[J]. 马金铭,苗红霞,苏新华,高畅,康学净,陶然.  光电工程. 2018(06)
[3]改进信号子空间结合维纳滤波的语音增强算法[J]. 曾明如,肖爱民,曾佳欣,习露.  科学技术与工程. 2018(03)
[4]基于FrFT域滤波的灵巧噪声干扰抑制方法[J]. 韩博文,杨小鹏.  信号处理. 2017(12)
[5]基于分数阶傅里叶变换的声呐探测信号鉴别[J]. 丁智慧,王彪.  舰船科学技术. 2017(17)
[6]一种基于修正倒谱平滑技术改进的维纳滤波语音增强算法[J]. 李季碧,马永保,夏杰,刘金刚.  重庆邮电大学学报(自然科学版). 2016(04)
[7]一种改进谱减法语音增强算法的研究[J]. 符成山.  信息通信. 2016(08)
[8]基于改进的小波阈值函数语音增强方法[J]. 董胡,谭乔来.  计算机系统应用. 2015(08)
[9]语音增强算法综述及性能分析[J]. 尹栋,蒋涉权,刘宝光,杨立东,王晶.  电声技术. 2015(05)
[10]基于双通道DFRFT互谱法的Chirp信号时延估计[J]. 李昕.  电子学报. 2014(06)

博士论文
[1]稀疏分数傅里叶变换理论及其在探测中的应用[D]. 刘升恒.北京理工大学 2016

硕士论文
[1]基于深度学习的语音增强方法研究[D]. 张鹤鸣.大连理工大学 2019
[2]数字助听器中基于深度学习的方向性语音增强算法研究[D]. 潘冬梅.北京工业大学 2019
[3]分数阶傅里叶变换在滚动轴承故障诊断中的应用[D]. 吕嘉良.哈尔滨理工大学 2019
[4]基于稀疏表示和深度学习的单通道语音信号分离技术研究[D]. 赵城.南京邮电大学 2018
[5]基于稀疏表示及二值掩码估计的语音增强算法研究[D]. 王虎.山东科技大学 2018
[6]基于噪声估计的语音增强算法研究与实现[D]. 王冕.湖南大学 2018
[7]基于稀疏表示的视频超分辨率技术研究[D]. 姚翠.电子科技大学 2018
[8]语音信号的增强及其识别算法[D]. 卢亚敏.南京信息工程大学 2018
[9]基于稀疏表示与联合字典学习的语音增强[D]. 魏明.苏州大学 2018
[10]基于表示学习的语音增强算法研究[D]. 吴佳雯.厦门大学 2017



本文编号:3217359

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3217359.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户087b3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com