语音信号中敲击按键声音的检测和抑制
本文关键词: 单通道语音增强 短时傅立叶变换 有监督稀疏非负矩阵分解 相关性 按键声音抑制 阈值技术 出处:《中国科学技术大学》2017年硕士论文 论文类型:学位论文
【摘要】:在近几十年来,使用电脑和笔记本电脑在不同的通信场景中录制音频已经有了显著增加,如讲座、会议、视频会议和互联网协议语音通信。一些人使用电脑和笔记本采集讲座音频用于存档,另一些人使用录音机来存档。由于键盘靠近麦克风,导致录制的语音被加性键盘敲击声严重破坏,这些噪声主要来自于机器键盘的打字声。由于敲击声的不平稳性和陡峭性,因此这是一个在单通道语音增强领域具有挑战性的问题。本文主要是抑制语音信号中的键盘敲击声。提出了两种新颖的用于检测和抑制冲击性键盘敲击声的两步算法,即基于相关技术的稀疏非负矩阵分解(SNMF-CR)和基于阈值技术的稀疏非负矩阵分解(SNMF-TT)。在这两种方法中,第一步都是用稀疏非负矩阵分解完成的。在第二步中提出了两种新的算法。在SNMF-CR中,从第一步中(SNMF阶段)估计得到的干净语音与原始带噪语音之间做相关。根据原始带噪语音中的噪声损坏段与估计干净语音中的噪声抑制段之间的低相关系数,原始带噪语音中的噪声段被来自第一步估计的干净语音中的相应噪声抑制段替换。在基于阈值的技术中,根据敲击声的能量比普通语音的频率轴分布更广泛的特点,将整个频谱图水平分为上下两部分。将高频能量的范数除以低频能量的范数,得到的比率跟门限比较从而用于检测键盘敲击声。在原始带噪语音中检测到的键盘敲击声片段被相应的由第一步估计的干净语音片段替代。因此,这两种方法中,没有被键盘敲击声破坏的语音段都被保留不变。在带噪的语音段,键盘噪声被抑制了但是语音质量并未下降。因此抑制敲击声后没有带来严重的语音失真,这是本论文的创新点。提出的算法主要和谱减法、增强的OM-LSA算法对比,所提出的算法具有更好的性能。
[Abstract]:In recent decades, the use of computers and laptops to record audio in different communication scenarios has increased significantly, such as lectures, conferences, Video conferencing and Internet protocol voice communication. Some people use computers and notebooks to collect lecture audio for archiving, others use tape recorders for archiving. Because the keyboard is close to the microphone, The recorded voice is severely damaged by the additive keystroke, which comes mainly from the typing sound of the machine keypad, due to the uneven stability and steepness of the percussive sound. Therefore, this is a challenging problem in the field of single channel speech enhancement. In this paper, we propose two novel two-step algorithms for detecting and suppressing impact keystroke. That is, sparse nonnegative matrix factorization based on correlation technique and sparse nonnegative matrix factorization based on threshold technique. In these two methods, The first step is done with sparse nonnegative matrix decomposition. In the second step, two new algorithms are proposed. In SNMF-CR, A correlation between the estimated clean speech and the original noisy speech is obtained from the first stage of SNMF. Based on the low correlation coefficient between the noise damage segment in the original noisy speech and the noise suppression segment in the estimated clean speech, The noise segment in the original noisy speech is replaced by the corresponding noise suppression segment in the clean speech estimated by the first step. Divide the whole spectrum level into two parts. Divide the norm of high frequency energy by the norm of low frequency energy, The ratio obtained is compared to the threshold to detect the keypad knock. The keypad knocks detected in the original noisy speech are replaced by the corresponding clean speech segments estimated by the first step. Therefore, in both methods, In noisy speech segments, keyboard noise is suppressed but the quality of the speech is not reduced. Therefore, the suppression of the knock does not result in serious speech distortion. This is the innovation of this paper. Compared with spectral subtraction and enhanced OM-LSA algorithm, the proposed algorithm has better performance.
【学位授予单位】:中国科学技术大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TN912.3
【相似文献】
相关期刊论文 前10条
1 徐泰燕;郝玉龙;;非负矩阵分解及其应用现状分析[J];武汉工业学院学报;2010年01期
2 何光辉;张太平;;保持拓扑性非负矩阵分解法在人脸识别的应用[J];计算机工程与应用;2010年14期
3 史加荣;焦李成;尚凡华;;不完全非负矩阵分解的加速算法[J];电子学报;2011年02期
4 王文俊;张军英;;一种非负矩阵分解的快速方法[J];计算机工程与应用;2009年25期
5 张雷鸣;李秋丹;廖胜才;;非负矩阵分解在标签语义分析中的应用[J];计算机科学;2010年04期
6 于彬;;基于局部非负矩阵分解的人脸识别[J];科学技术与工程;2010年33期
7 姜伟;杨炳儒;隋海峰;;局部敏感非负矩阵分解[J];计算机科学;2010年12期
8 宋金歌;杨景;陈平;佘玉梅;;一种非负矩阵分解的快速稀疏算法[J];云南民族大学学报(自然科学版);2011年04期
9 高燕燕;;非负矩阵分解及其应用探讨[J];硅谷;2011年23期
10 郝红;徐常青;张新平;;基于非负矩阵分解的航拍图像信息提取[J];浙江农林大学学报;2012年01期
相关会议论文 前10条
1 孙江明;李通化;;非平滑三维非负矩阵分解[A];第九届全国计算(机)化学学术会议论文摘要集[C];2007年
2 蒋永锴;叶东毅;;基于稀疏非负矩阵分解的自动多文摘方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
3 马帅;吴飞;杨易;邵健;;基于稀疏非负矩阵分解的图像检索[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【oral】[C];2011年
4 徐利民;龚珊;余再军;;奇异值分解与非负矩阵分解色在数据降维方面的特性分析[A];2010年通信理论与信号处理学术年会论文集[C];2010年
5 蔡蕾;朱永生;;基于稀疏性非负矩阵分解和支持向量机的轴心轨迹图识别[A];2008年全国振动工程及应用学术会议暨第十一届全国设备故障诊断学术会议论文集[C];2008年
6 蒋霈霖;;KL散度下的非负矩阵分解[A];中国自动化学会中南六省(区)2010年第28届年会·论文集[C];2010年
7 杨宝;朱启兵;黄敏;;基于非负矩阵分解一稀疏表示分类的玻璃缺陷图像识别[A];第24届中国控制与决策会议论文集[C];2012年
8 钱乐乐;高隽;徐小红;;非负性约束的图像稀疏编码[A];第七届全国信息获取与处理学术会议论文集[C];2009年
9 朱昊;黄源水;付梦印;;基于NMF的道路识别算法在野外环境感知中的应用[A];第九届全国光电技术学术交流会论文集(下册)[C];2010年
10 郑能恒;蔡毅;李霞;Tan Lee;;基于非负矩阵分解和向量相似测度的语音与音乐分离算法[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
相关博士学位论文 前10条
1 杨士准;基于样本和特征的迁移学习方法及应用[D];国防科学技术大学;2013年
2 叶军;基于正则化方法的非负矩阵分解算法及其应用研究[D];南京理工大学;2014年
3 陆玉武;图像分类中流形回归与非负矩阵分解研究[D];哈尔滨工业大学;2015年
4 张恩德;在线社会网络分析与挖掘若干关键问题研究[D];东北大学;2014年
5 胡俐蕊;非负矩阵分解方法及其在选票图像识别中的应用[D];安徽大学;2013年
6 殷海青;图像分析中的非负矩阵分解理论及其最优化和正则化方法研究[D];西安电子科技大学;2011年
7 杨洪礼;非负矩阵与张量分解及其应用[D];山东科技大学;2011年
8 史加荣;多尺度张量逼近及应用[D];西安电子科技大学;2012年
9 方蔚涛;人脸识别特征抽取算法的研究[D];重庆大学;2012年
10 刘昱昊;基于非负矩阵分解算法的人脸识别技术的研究[D];吉林大学;2014年
相关硕士学位论文 前10条
1 谢昊;非负矩阵分解初始化及其应用[D];暨南大学;2015年
2 王一;凸与半非负矩阵分解的近点梯度方法研究[D];东北师范大学;2015年
3 项磊;基于乳腺癌计算机辅助诊断的病理图像分析[D];南京信息工程大学;2015年
4 王丹;基于非负矩阵分解的脑电信号特征提取算法研究[D];燕山大学;2015年
5 马春霞;非负矩阵分解及在基因表达数据分析中的应用研究[D];曲阜师范大学;2015年
6 崔艳荣;基于非负矩阵分解的高光谱遥感数据融合方法分析及应用[D];电子科技大学;2014年
7 赖淑珍;非负矩阵分解若干算法研究与应用[D];电子科技大学;2014年
8 赵龙;基于多流形正则化非负矩阵分解的多视图聚类[D];大连理工大学;2015年
9 黄震;基于多视角非负矩阵分解的同名区分算法研究[D];大连理工大学;2015年
10 邵强;改进的非负矩阵分解算法及其在人脸识别中的应用[D];河北工业大学;2015年
,本文编号:1548796
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/1548796.html