语音增强改进算法研究及其DSP的实现

发布时间：2017-07-28 08:14

第一章绪论

1.1 语音增强研究的背景和意义
随着现代科学技术的迅速发展，语音通信是当前信息时代重要的信息交互手段。在实际应用中，语音信号往往会受到其他背景噪声的干扰，对语音通信的正常进行造成较大的影响。因此，研究如何在有各种背景噪音干扰的条件下，仍能有效地分离出纯净的语音信息，消除背景噪声的干扰，越来越得到了人们的重视。如果语音信号被不同的噪声影响和淹没后，通过抑制和降低噪声影响，以提取有用信号的技术被称为语音增强，该技术的主要目的是提高语音质量、降低噪声[2]，从而提高信号的输出信噪比（Signal ro Noise Ratio,SNR）。实际应用环境中的噪声类型有很多种，其特性也是多种多样，纯净语音在噪声的影响下受到极大破坏。虽然目前语音增强的方法不断更新，也均取得了一定程度的突破。但是在实际应用中，应依据噪声变化的多样性，并参照当时具体的实际环境，通过选取恰当的语音增强方法来保证有较好的语音增强效果。随着 DSP 技术和语音增强算法的不断发展，目前语音增强技术被广泛应用在于汽车电话、无线电话电视会议、人机对话语音识别、电子耳蜗、智能家电、战场通信和军事窃听等领域。日常生活中，人们之间远距离的通信方式基本上都采用电话方式，例如安装在汽车上电话，街道、机场的公用电话以及移动电话，但是我们在享受科技进步带来的便利时，也常常会受到各种背景噪声的影响，如无线通信信道的干扰，对通话质量会产生严重影响。例如，在雷雨等恶劣天气接听移动电话，会听到阵阵噪声。因此，在接收端通过估计噪声干扰模型，滤出噪声，实现语音增强并保证通话质量。
........

1.2 语音增强技术的发展
语音增强早在 20 世纪 60 年代就受到了人们的重视，在随后的四十多年里，国外学者对这一课题进行了持续研究，尤其是 Boll 提出的谱相减法，一直被广泛应用，许多学者也在此基础上做出了大量改进。国内近年来也有大量学者对语音增强算法进行了研究，取得了较好的成果。清华大学崔玮玮将 FDM阵列技术与单通道增强方法相结合，提出了双通道的语音增强算法，与双通道相比，信噪比提高，计算复杂度被降低[3]；大连理工大学金乃高将系统分析中的子带技术和粒子滤波技术相结合，提出了一种基于子带粒子滤波的语音增强方法，提高系统性能的同时也降低了计算复杂度[4]。中国科技术大学的章旭景为提高卡尔曼滤波算法的性能，提出的改进语音增强算法用子带卡尔曼滤波代替卡尔曼滤波，降低了改进之前语音增强算法的计算复杂度[5]；解放军理工大学的黄建军提出时频字典学习的单通道语音增强算法，解决了非平稳环境下系统性能下降的问题[6]；太原理工大学的任永梅提出了基于新阈值函数的小波语音增强算法，较大程度上解决了语音严重失真的问题[7]；重庆大学的王瑜林在原有语音增强方法的基础上，提出基于自适应滤波技术的单通道语音增强算法，一定程度上解决了传统语音增强算法的两个问题：适应性差和收敛速度慢[8]；中国科学院声学研究所的王玥依据听觉掩蔽效应，提出了听觉频域掩蔽效应的?自适阶贝叶斯感知估计语音增强算法，平衡了语音失真和噪声抑制[9]；西北工业大学的张君昌提出了一种自适应时移与阈值的DCT 音增强方法，其优点是提高了系统的鲁棒性和输出信噪比[10]；太原理工大学的郭欣提出了利用子空间改进的K ?SVD 语音增强算法，可有效去除白噪声[11]。数字信号处理技术（Digital Signal Processing，DSP）自 20 世纪 60 年代以来[12]，随
着计算机技术的推进也快速发展。该技术之所以应用广泛，因为它既涉及数字信号处理的理论和方法的研究，又涉及各种关于数字信号的处理应用。随着 DSP 技术的发展，语言增强的实时实现成为可能，可广泛用于无线电话会议、手机、娱乐系统、多媒体应用等领域。在实际应用中，对语音信号处理之前会对其进行预处理，因此语音增强技术可广泛应用于各种语音信号处理领域中。本文对语音增强算法进行了改进，在 MATLAB环境下对其进行了仿真验证和在 DSP 环境下进行了实时实现，有较大的实用性。
..........

第二章语音增强算法理论基础

在语音信号分析的基础上，我们才能多种语音进行处理，通过分析语音信号可得出其本质的参数，通过它们的本质参数可将语音信号增强和传递。因此语音信号分析在语音信号处理和增强中，具有极其重要的作用。

2.1 语音产生模型及其特性分析

语音是在大脑的支配下，通过肺、喉和声道的共同协调合作产生的。通过对发声器官和发音过程的研究，可进一步建立一个时域离散的语音信号产生模型[24-25]。语音产生的模型如图 2.1 所示，它分为激励源、声道模型和辐射模型三个模块。人耳的掩蔽效应，就是比较弱小的信号会被一些强大的信号衰减掉或者直接屏蔽，导致发现不到这些弱信号[29-30]。掩蔽效应的程度由声音强度与频率二者的关系决定，人耳对频差大的分量的掩蔽远高于对频率临近分量的掩蔽。如果声音 B 的出现可以提高声音 A 能够感知的阈值，那么我们就把 B 叫做掩蔽声音，A 叫做被掩蔽声音(Masked Tone)，掩蔽音刚好能听见时掩蔽音的强度成为掩蔽阈值。利用掩蔽效应改善输出语音质量，在语音编码中己经取得了很大的成效。同时性掩蔽是听觉系统的重要特性之一，这是指掩蔽音和被掩蔽音会出现在同一时刻。如图 2.4 为掩蔽曲线。

........

2.2 语音和噪音特性
语音信号的特征如下：（1）语音信号具有短时平稳性；（2）语音可以分为浊音和清音；（3）语音信号的描述可用统计分析特性来表示[26-27]。噪声是指在实际环境中人们不需要的声音，这种声音对人们正常休息、学习和工作产生了干扰，严重影响了人们的正常生活。此外，杂乱的振幅和频率，断续或统计上无规律的声振动也是噪声。噪声有加性和非加性之分。一般在理论中，加性噪声是最常被研究所用的。要想利用非加性噪声，就必须使其转换为加性噪声[28]。转换的方式通常采用同态变换，此类方法就可实现非加性噪声转换成为加性噪声。带噪语音模型如图 2.2 所示，其表达式如式（2.4）所示。
........

第三章语音增强改进算法.....12
3.1 改进型语音活性检测技术.............12
3.2 改进型功率谱减法....... 17
3.2.1 功率谱减法........ 17
3.2.2 改进型功率谱减法.....20
3.3 本章小结...... 22
第四章语音增强系统设计与 DSP 实现......... 23
4.1 语音增强系统结构设计........23
4.2 开发环境概述.......23
4.3 DSP 系统初始化程序设计............ 25
4.4 语音增强算法在 DSP 中的实现............28
4.5 本章小结...... 31
第五章语音增强技术改进算法仿真及实现............32
5.1 语音增强技术改进算法 MATLAB 仿真及结果分析.............32
5.2 语音增强技术改进算法的 DSP 实现.............37
5.3 本章小结.......... 40

第五章语音增强技术改进算法仿真及实现

本章内容主要介绍了语音增强技术的改进算法在 MATLAB 环境下的仿真以及在DSP 上的实现，并对两种实验结果进行了具体分析。

5.1 语音增强技术改进算法 MATLAB 仿真及结果分析
图 5.1 可看出，通过基于短时能量及过零率双门限的语音活性检测技术可以精确检测出语音端点。但是由于在采集语音信号样本时，清音并没有发出，只有浊音组成，基于浊音明显的周期性，所以对语音的端点可以准确判断。和理论研究不同，在实际环境运算时，为避免因为其他偶然因素产生误差，所以阈值的确定要准确判定。所以对阈值的设置应至少大于噪声能量，而通常情况下，噪声能量一般在 50 以上。利用 MATLAB 仿真可以得到增强后的语音波形图、信噪比等。然后通过主观的平均意见得分法进行测试。算法测试的流程图如图 5.2 所示。由于是在 MATLAB 仿真环境下进行实验，所以语音样本是通过计算机自带的录音机录制的。字数长短对实验结果有很大的影响，所以采集样本时只选择了录制 10 个字：“长安大学信息工程学院”，噪声材料则选择在长安大学南二环路上采集的汽车噪声。由第二章语音增强算法基础理论简介可知，在对语音信号处理之前，必须对其进行预处理和加窗处理。所以在本次实验前采集到的语音和噪声样本首先要通过 8k Hz 的采样，然后接着是 16bit 的量化过程，语音信号转变为可处理的数字信号。实验过程中为了确保验证算法的准确性，所以对语音信号的语音增强处理需要在不同信噪比的环境下处理。含噪语音应当为 256 长度的语音帧，以确保实验结果的精确度。如若不是，则要经过加窗处理。
.........

总结

本文对基本功率谱的语音增强算法进行了研究，并对基于语音活性检测技术和功率谱减法的算法进行了一定的改进，将两种方法相结合。在语音增强处理之前，先采用语音活性检测技术对其处理，接着用改进型功率谱减法对语音信号进行语音增强处理。关于硬件系统的选择，，采用了基于 TMS320C6713 的 DSP 硬件处理系统。现对本文主要完成的工作总结如下：（1）参考国内外文献，详细分析语音增强技术的应用背景和发展史，并且对语音增强算法进行综述。（2）了解语音增强算法基础理论，同时针对语音增强的处理效果，引出了两类评价方法：主观评价和客观评价，为语音增强算法的研究、改进和评测提供了理论基础和依据。（3）本文对功率谱减法算法的各项特性指标进行了详细的论证，并在此基础上提出了改进的功率谱减法，同时文章还分析了影响算法性能的几个关键因素，完善改进型功率谱减法。并且提出了基于短时过零率和短时能量的双门限语音活性检测技术，提高了对语音起始点判断的准确性。（4）在 CCS 集成开发环境下，实现了改进型功率谱减法和语音活性检测技术算法，并对两种改进技术在 MATLAB 环境下进行仿真，对两种仿真结果进行了对比分析。利用两种评价方法，更加直观的证明改进型算法提高了语音质量和系统性能。
.........
参考文献(略)

本文编号：582930

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/wenshubaike/kjzx/582930.html

上一篇：长城云计算教室在广西中小学推广研究
下一篇：中学班级管理常见问题与应对措施论析论文

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|