当前位置:主页 > 科技论文 > 网络通信论文 >

稀疏卷积非负矩阵分解的语音增强算法

发布时间:2018-11-17 16:25
【摘要】:鉴于卷积非负矩阵分解在语音增强算法中的成功应用,进一步考虑语音信号在时频域的稀疏性,提出了稀疏卷积非负矩阵分解(Sparse convolutive nonnegative matrix factorization,SCNMF)的语音增强算法。该算法包括训练和增强两个阶段。训练阶段通过SCNMF算法分别对纯净语音和噪声的频谱进行训练,得到纯净语音和噪声字典,并将其作为增强阶段的先验信息。增强阶段首先通过SCNMF算法对带噪语音的频谱进行分解,然后利用纯净语音和噪声联合字典以及相应的迭代公式对语音编码矩阵进行估计,重构增强语音。通过实验仿真分析了稀疏因子对增强语音质量的影响。实验结果表明,在非平稳噪声和低信噪比条件下,本文算法增强效果均优于多带谱减、非负矩阵分解和卷积非负矩阵分解等传统的算法。
[Abstract]:In view of the successful application of convolutional nonnegative matrix factorization in speech enhancement algorithm, a speech enhancement algorithm based on sparse convolutional nonnegative matrix factorization (Sparse convolutive nonnegative matrix factorization,SCNMF) is proposed, considering the sparsity of speech signal in time-frequency domain. The algorithm includes two stages: training and enhancement. In the training stage, the pure speech and noise dictionaries are obtained by training the spectrum of pure speech and noise by SCNMF algorithm respectively, and they are regarded as the prior information of the enhancement stage. In the enhancement phase, the spectrum of noisy speech is decomposed by SCNMF algorithm, and then the speech coding matrix is estimated by using the joint dictionary of pure speech and noise and the corresponding iterative formula to reconstruct the enhanced speech. The effect of sparse factor on speech quality enhancement is analyzed by simulation. The experimental results show that the enhancement effect of this algorithm is better than that of traditional algorithms such as multi-band spectral subtraction, non-negative matrix decomposition and convolution non-negative matrix factorization under the condition of non-stationary noise and low signal-to-noise ratio.
【作者单位】: 解放军理工大学指挥信息系统学院;西安通信学院基础部;
【基金】:江苏省自然科学基金(BK2012510)资助项目
【分类号】:TN912.3

【参考文献】

相关期刊论文 前1条

1 黄建军;张雄伟;张亚非;邹霞;;时频字典学习的单通道语音增强算法[J];声学学报;2012年05期

【共引文献】

相关期刊论文 前2条

1 马振;张雄伟;杨吉斌;徐玉龙;;基于稀疏卷积非负矩阵分解的语音转换方法研究[J];军事通信技术;2013年02期

2 马振;张雄伟;杨吉斌;;基于语音个人特征信息分离的语音转换方法研究[J];信号处理;2013年04期

相关硕士学位论文 前1条

1 黄书华;单通道盲源分离法研究及应用[D];太原科技大学;2013年

【二级参考文献】

相关期刊论文 前3条

1 蔡泽民;赖剑煌;;一种基于超完备字典学习的图像去噪方法[J];电子学报;2009年02期

2 徐宁;杨震;张玲华;;基于状态空间模型的子频带语音转换算法[J];电子学报;2010年03期

3 吴红卫;俞一彪;吴镇扬;;基于Laplace-Gauss模型和简化相位判别的离散余弦变换域语音增强[J];声学学报(中文版);2008年03期

【相似文献】

相关期刊论文 前10条

1 马晓红,殷福亮,陆晓燕,王晓宁;基于小波变换的传声器阵列语音增强方法[J];大连理工大学学报;2003年04期

2 徐爽,韩芳芳,郑德忠;基于阈值的小波域语音增强新算法[J];传感技术学报;2004年01期

3 邹采荣;陈国明;赵力;;基于泄漏约束的DF-GSC语音增强(英文)[J];Journal of Southeast University(English Edition);2007年04期

4 彭煊,刘金福,王炳锡;基于独立分量分析的语音增强[J];信号处理;2002年05期

5 沈亚强;基于多分辨率子波变换的自适应滤波语音增强方法[J];浙江工商职业技术学院学报;2003年04期

6 钱永玲;面向NGN的三重播放——7302 ISAM语音增强型接入平台[J];通讯世界;2005年11期

7 李楠;;一种小波变换与维纳滤波结合的语音抗噪研究[J];电声技术;2007年05期

8 张丽艳;殷福亮;;一种改进的奇异值分解语音增强方法[J];电子与信息学报;2008年02期

9 徐岩,杨静,王维汉;基于谱相减改进算法的语音增强研究[J];铁道学报;2004年01期

10 石鸿凌,姜琳峰,孙洪;基于TVAR模型的语音增强技术[J];武汉大学学报(工学版);2004年02期

相关会议论文 前10条

1 周小星;王安娜;孙红英;杨鸿武;;基于压缩感知过程的语音增强[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年

2 陶智;赵鹤鸣;;Bark子波变换在语音增强中的应用[A];现代通信理论与信号处理进展——2003年通信理论与信号处理年会论文集[C];2003年

3 欧贵文;柯登峰;;基于噪音估计和参数估计的优化语音增强算法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年

4 国雁萌;;一种极低信噪比条件下的语音增强方法[A];第六届全国人机语音通讯学术会议论文集[C];2001年

5 江峰;李晓东;;适用于抑制非平稳背景噪声的语音增强算法[A];中国声学学会2003年青年学术会议[CYCA'03]论文集[C];2003年

6 王安娜;周小星;孙红英;杨鸿武;;基于压缩感知过程的语音增强新算法[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年

7 吴亚栋;吴旭辉;;一种基于自相关域动态噪声估计方式的语音增强法[A];第六届全国人机语音通讯学术会议论文集[C];2001年

8 丁沛;曹志刚;;基于语音增强失真补偿的抗噪声语音识别技术[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年

9 阎兆立;杜利民;;维纳后滤波语音增强算法研究[A];中国声学学会2005年青年学术会议[CYCA'05]论文集[C];2005年

10 赵亚丽;付中华;谢磊;张健;张艳宁;;双麦克风语音增强和杂混模型训练相结合的顽健说话人确认[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年

相关重要报纸文章 前7条

1 ;打造三重播放接入平台[N];中国电子报;2005年

2 ;7302 ISAM面向NGN支持三重播放[N];通信产业报;2005年

3 王向东 栾焕博 林守勋 钱跃良;语音识别:抗噪音能力有待加强[N];计算机世界;2006年

4 耿青涛;提高无线语音质量 实现语音增值服务[N];中国计算机报;2003年

5 ;StudioSound:高性能的语音质量[N];通信产业报;2003年

6 ;其它网络编辑选择奖获奖产品展示[N];中国计算机报;2002年

7 ;NMS Sonata Ⅲ/Studio Sound级语音增强系统话音更清晰[N];中国计算机报;2003年

相关博士学位论文 前10条

1 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年

2 陶智;低信噪比环境下语音增强的研究[D];苏州大学;2011年

3 方瑜;语音增强相关问题研究[D];北京邮电大学;2012年

4 袁文浩;基于噪声估计的语音增强方法研究[D];华东理工大学;2013年

5 王娜;基于小波变换与约束方差噪声谱估计的语音增强算法研究[D];燕山大学;2011年

6 王海艳;基于统计模型的语音增强算法研究[D];吉林大学;2011年

7 姚峰英;语音增强系统的研究与实现[D];中国科学院上海冶金研究所;2001年

8 申丽然;Hilbert-Huang变换及其在含噪语音信号处理中的应用研究[D];哈尔滨工程大学;2006年

9 崔玮玮;基于麦克风阵列的声源定位与语音增强方法研究[D];清华大学;2009年

10 马晓红;传声器阵列语音增强中关键技术的研究[D];大连理工大学;2006年

相关硕士学位论文 前10条

1 邬鑫锋;基于短时谱估计的语音增强研究[D];湘潭大学;2010年

2 陶智;基于人耳听觉掩蔽效应的语音增强的研究[D];苏州大学;2003年

3 孔祥波;基于短时幅度谱估计的语音增强方法研究[D];大连理工大学;2000年

4 朱健华;语音增强方法的研究[D];大连理工大学;2002年

5 武睿;数学形态学在语音增强中的应用[D];河北工业大学;2004年

6 段国和;战场环境下的自适应语音增强[D];西北工业大学;2005年

7 王龙;基于DSP的语音增强系统的研究与设计[D];东华大学;2011年

8 缪春波;语音增强及其相关技术的研究[D];大连理工大学;2003年

9 董婧;基于语音增强及小波变换基音检测的LPC-MBE低速语音编码算法[D];吉林大学;2004年

10 冯炎;基于噪声估计和先验信噪比估计的语音增强算法研究[D];西南交通大学;2010年



本文编号:2338429

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/2338429.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户dc3cb***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com