基于计算听觉场景分析的单通道语音盲分离技术

发布时间：2017-05-16 12:01

本文关键词：基于计算听觉场景分析的单通道语音盲分离技术，由笔耕文化传播整理发布。

【摘要】：作为最有效直接的交流方式,语音却总是受到实际环境中各种干扰或噪声的影响。但是基于人类独特的听觉场景分析,人耳总能妥善处理各种情况,敏锐地捕获各种特定信号。利用计算机模拟人耳的感知过程并对听觉场景进行建模,实现语音分离的过程即计算听觉场景分析(Computer Auditory Scene Analysis,CASA),已成为近年来语音信号处理领域的一个研究热点。本文在详细分析CASA理论知识及其经典算法的基础上,针对干扰信号为非语音信号和其他语音信号两种情况,研究基于CASA的单通道语音分离问题。主要研究工作如下:针对从非语音干扰中分离语音的问题,现有的基于CASA的算法大多集中于对浊音分离的研究,对清音分离的研究较少。本文对基于CASA和谱减法的清音分离算法进行改进,针对原算法运算量大和清音背景噪声估计不准确的问题,在清音分离前先通过估计声音信号的开始和结束时刻(Onset/Offsett)找出可能存在清音的时频区域,并利用相邻时频单元能量具有连续性的原理,对清音时频块中每一时频单元分别进行噪声能量估计。仿真结果表明,改进算法比原算法运算量更小,对清音分离的有效性更高。针对干扰信号也是语音即双语音分离问题,本文提出了一种结合CASA和说话人识别的双语音分离系统。利用Tandem算法实现浊音同时组织,基于Gammatone频率倒谱系数(Gammatone frequency cepstral coefficients,GFCC)的聚类建立目标函数实现说话人识别,并通过穷举搜索或束搜索找到最佳分组,实现浊音序列组织。通过Onset/Offset分析产生清音段,并将清音段中的清音-浊音(U-V)段和清音-清音(U-U)段分别进行处理,U-V段利用已分离的浊音二值模进行分离,U-U段则简单均分给两个声源,实现清音分离。通过仿真实验和性能评估验证了所提算法的可行性和有效性。
【关键词】：计算听觉场景分析 语音分离 谱减法 清音分离 GFCC
【学位授予单位】：太原理工大学
【学位级别】：硕士
【学位授予年份】：2016
【分类号】：TN912.3
【目录】：

摘要3-5
ABSTRACT5-10
第一章绪论10-14
1.1 语音分离研究背景与意义10-11
1.2 计算听觉场景分析的发展历程及研究现状11-13
1.3 本论文的结构安排13-14
第二章计算听觉场景分析概述14-19
2.1 语音信号特征14
2.2 人耳的感知特性14-15
2.3 听觉场景分析理论15-16
2.4 计算听觉场景分析基础16-19
第三章基于Tandem算法的混叠语音分离19-29
3.1 听觉外围处理和特征提取19-22
3.1.1 听觉外围处理19-21
3.1.2 特征提取21-22
3.2 给定基音周期标记二值模22-24
3.3 给定二值模估计目标基音24-25
3.4 迭代过程25-28
3.4.1 初始估计25-27
3.4.2 迭代估计27-28
3.4.3 时频段标记28
3.5 本章小结28-29
第四章基于CASA和谱减法的清音分离改进算法29-41
4.1 系统结构29-30
4.2 清音分离30-35
4.2.1 去除周期信号30-31
4.2.2 背景噪声能量估计31-32
4.2.3 改进背景噪声能量估计32-33
4.2.4 谱减法去除噪声33-35
4.3 仿真实验和性能评估35-40
4.3.1 仿真实验35-37
4.3.2 性能评估37-40
4.4 本章小结40-41
第五章基于CASA的无监督双语音分离41-55
5.1 算法结构42
5.2 GFCC特征提取42-43
5.3 浊音分离43-46
5.3.1 Tandem算法实现同时组织43-44
5.3.2 聚类方法实现序列组织44-46
5.4 清音分离46-47
5.5 仿真实验和性能评估47-53
5.5.1 仿真实验47-51
5.5.2 性能评估51-53
5.6 本章小结53-55
第6章总结与展望55-57
6.1 论文工作总结55-56
6.2 研究工作展望56-57
参考文献57-63
致谢63-64
在学期间发表的学术论文64

【相似文献】

中国期刊全文数据库前10条

1 谢贵武;杨继红;肖勇;闵刚;;基于语音分段的自适应时长调整算法[J];军事通信技术;2008年02期

2 樊建中;孙晴;杨永杰;;一种智能盲文学习机设计[J];现代电子技术;2010年05期

3 温洪昌;黄应强;傅贵兴;;单片机的多段语音组合录放系统设计[J];单片机与嵌入式系统应用;2011年10期

4 张剑;袁华强;;Rhetorical-State SVM在抽取式语音摘要中的应用[J];科学技术与工程;2013年21期

5 卢坚 ,毛兵 ,孙正兴 ,张福炎;一种改进的基于说话者的语音分割算法[J];软件学报;2002年02期

6 章文义,朱杰;几种无语音检测噪音估计方法的比较研究[J];计算机工程与设计;2003年10期

7 林鑫;陈桦;王开志;王继成;;语音驱动唇形自动合成算法[J];计算机工程;2007年17期

8 蔡铁;;基于在线单类支持向量机的自适应语音活动检测[J];深圳信息职业技术学院学报;2008年02期

9 章钊;郭武;;话者识别中结合模型和能量的语音激活检测算法[J];小型微型计算机系统;2010年09期

10 朱淑琴,裘雪红;一种精确检测语音端点的方法[J];计算机仿真;2005年03期

中国重要会议论文全文数据库前9条

1 田野;王作英;陆大金;;基于韵律结构信息的非语音拒识[A];第六届全国人机语音通讯学术会议论文集[C];2001年

2 徐明;胡瑞敏;黄云森;;基于音素识别的语音评价方法[A];第二届和谐人机环境联合学术会议(HHME2006)——第15届中国多媒体学术会议(NCMT'06)论文集[C];2006年

3 王欢良;韩纪庆;李海峰;王承发;;面向嵌入式应用的小词汇量语音串识别系统[A];第七届全国人机语音通讯学术会议（NCMMSC7）论文集[C];2003年

4 那斯尔江·吐尔逊;吾守尔·斯拉木;麦麦提艾力;;维吾尔语大词汇量连续语音识别研究——语音语料库的建立[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年

5 简志华;王向文;;考虑帧间信息的语音转换算法[A];浙江省信号处理学会2012学术年会论文集[C];2012年

6 魏维;马海燕;;一种丢失语音信包重建的新算法[A];通信理论与信号处理新进展——2005年通信理论与信号处理年会论文集[C];2005年

7 陈凡;罗四维;;一个实用语音开发应用系统的设计与实现[A];第二届全国人机语音通讯学术会议论文集[C];1992年

8 刘红星;戴蓓劏;陆伟;;基于图像增强方法的共振峰谐波能量参数的语音和端点检测[A];第九届全国人机语音通讯学术会议论文集[C];2007年

9 林爱华;张文俊;王毅敏;;基于肌肉模型的语音驱动唇形动画[A];第十三届全国图象图形学学术会议论文集[C];2006年

中国重要报纸全文数据库前5条

1 atvoc;数码语音电路产品概述[N];电子资讯时报;2008年

2 记者李山;德用双音素改进人工语音表达[N];科技日报;2012年

3 中国科学院自动化研究所模式识别国家重点实验室于剑邋陶建华;个性化语音生成技术面面观[N];计算机世界;2007年

4 江西林慧勇;语音合成芯片MSM6295及其应用[N];电子报;2006年

5 ;与“小超人”对话[N];中国计算机报;2001年

中国博士学位论文全文数据库前10条

1 高伟勋;智能家居环境中个性化语音生成关键技术研究[D];东华大学;2015年

2 陶冶;文本语音匹配的研究和应用[D];山东大学;2009年

3 何俊;声纹身份识别中非常态语音应对方法研究[D];华南理工大学;2012年

4 李冬冬;基于拓展和聚类的情感鲁棒说话人识别研究[D];浙江大学;2008年

5 双志伟;个性化语音生成研究[D];中国科学技术大学;2011年

6 古今;语音感知认证的关键技术研究[D];中国科学技术大学;2009年

7 彭波;Internet上语音的鲁棒性传输研究[D];华南理工大学;2001年

8 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年

9 应娜;基于正弦语音模型的低比特率宽带语音编码算法的研究[D];吉林大学;2006年

10 田立斌;语音通信质量客观评价、有效接收及错误恢复算法研究[D];华南理工大学;2004年

中国硕士学位论文全文数据库前10条

1 王明明;基于GMM和码本映射相结合的语音转换方法研究[D];西安建筑科技大学;2015年

2 印雪晨;宋词朗读呼吸信号和韵律时长研究[D];西北民族大学;2015年

3 邱一良;噪声环境下的语音检测方法研究[D];电子科技大学;2015年

4 朱俊梅;基于性别预分类的年龄自动估计研究[D];江苏师范大学;2014年

5 张占松;基于DSP的语音干扰方法研究与实现[D];北京交通大学;2016年

6 李鹏;基于系统融合的语音查询项检索技术研究[D];解放军信息工程大学;2015年

7 赵蓉蓉;基于计算听觉场景分析的单通道语音盲分离技术[D];太原理工大学;2016年

8 周慧;基于PAD三维情绪模型的情感语音转换与识别[D];西北师范大学;2009年

9 李尘一;基于联合得分的语音置信度评估系统的研究与设计[D];内蒙古大学;2006年

10 朱君波;PCA在语音检测中的应用研究[D];浙江工业大学;2004年

本文关键词：基于计算听觉场景分析的单通道语音盲分离技术，由笔耕文化传播整理发布。

，

本文编号：370752

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/370752.html

上一篇：基于簇结构优化的无线传感器网络非均匀分簇路由算法
下一篇：基于通用处理器的LTE系统MAC子层的设计与实现

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|