当前位置:主页 > 科技论文 > 信息工程论文 >

基于计算听觉场景分析的单通道语音盲分离技术

发布时间:2017-05-16 12:01

  本文关键词:基于计算听觉场景分析的单通道语音盲分离技术,由笔耕文化传播整理发布。


【摘要】:作为最有效直接的交流方式,语音却总是受到实际环境中各种干扰或噪声的影响。但是基于人类独特的听觉场景分析,人耳总能妥善处理各种情况,敏锐地捕获各种特定信号。利用计算机模拟人耳的感知过程并对听觉场景进行建模,实现语音分离的过程即计算听觉场景分析(Computer Auditory Scene Analysis,CASA),已成为近年来语音信号处理领域的一个研究热点。本文在详细分析CASA理论知识及其经典算法的基础上,针对干扰信号为非语音信号和其他语音信号两种情况,研究基于CASA的单通道语音分离问题。主要研究工作如下:针对从非语音干扰中分离语音的问题,现有的基于CASA的算法大多集中于对浊音分离的研究,对清音分离的研究较少。本文对基于CASA和谱减法的清音分离算法进行改进,针对原算法运算量大和清音背景噪声估计不准确的问题,在清音分离前先通过估计声音信号的开始和结束时刻(Onset/Offsett)找出可能存在清音的时频区域,并利用相邻时频单元能量具有连续性的原理,对清音时频块中每一时频单元分别进行噪声能量估计。仿真结果表明,改进算法比原算法运算量更小,对清音分离的有效性更高。针对干扰信号也是语音即双语音分离问题,本文提出了一种结合CASA和说话人识别的双语音分离系统。利用Tandem算法实现浊音同时组织,基于Gammatone频率倒谱系数(Gammatone frequency cepstral coefficients,GFCC)的聚类建立目标函数实现说话人识别,并通过穷举搜索或束搜索找到最佳分组,实现浊音序列组织。通过Onset/Offset分析产生清音段,并将清音段中的清音-浊音(U-V)段和清音-清音(U-U)段分别进行处理,U-V段利用已分离的浊音二值模进行分离,U-U段则简单均分给两个声源,实现清音分离。通过仿真实验和性能评估验证了所提算法的可行性和有效性。
【关键词】:计算听觉场景分析 语音分离 谱减法 清音分离 GFCC
【学位授予单位】:太原理工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN912.3
【目录】:
  • 摘要3-5
  • ABSTRACT5-10
  • 第一章 绪论10-14
  • 1.1 语音分离研究背景与意义10-11
  • 1.2 计算听觉场景分析的发展历程及研究现状11-13
  • 1.3 本论文的结构安排13-14
  • 第二章 计算听觉场景分析概述14-19
  • 2.1 语音信号特征14
  • 2.2 人耳的感知特性14-15
  • 2.3 听觉场景分析理论15-16
  • 2.4 计算听觉场景分析基础16-19
  • 第三章 基于Tandem算法的混叠语音分离19-29
  • 3.1 听觉外围处理和特征提取19-22
  • 3.1.1 听觉外围处理19-21
  • 3.1.2 特征提取21-22
  • 3.2 给定基音周期标记二值模22-24
  • 3.3 给定二值模估计目标基音24-25
  • 3.4 迭代过程25-28
  • 3.4.1 初始估计25-27
  • 3.4.2 迭代估计27-28
  • 3.4.3 时频段标记28
  • 3.5 本章小结28-29
  • 第四章 基于CASA和谱减法的清音分离改进算法29-41
  • 4.1 系统结构29-30
  • 4.2 清音分离30-35
  • 4.2.1 去除周期信号30-31
  • 4.2.2 背景噪声能量估计31-32
  • 4.2.3 改进背景噪声能量估计32-33
  • 4.2.4 谱减法去除噪声33-35
  • 4.3 仿真实验和性能评估35-40
  • 4.3.1 仿真实验35-37
  • 4.3.2 性能评估37-40
  • 4.4 本章小结40-41
  • 第五章 基于CASA的无监督双语音分离41-55
  • 5.1 算法结构42
  • 5.2 GFCC特征提取42-43
  • 5.3 浊音分离43-46
  • 5.3.1 Tandem算法实现同时组织43-44
  • 5.3.2 聚类方法实现序列组织44-46
  • 5.4 清音分离46-47
  • 5.5 仿真实验和性能评估47-53
  • 5.5.1 仿真实验47-51
  • 5.5.2 性能评估51-53
  • 5.6 本章小结53-55
  • 第6章 总结与展望55-57
  • 6.1 论文工作总结55-56
  • 6.2 研究工作展望56-57
  • 参考文献57-63
  • 致谢63-64
  • 在学期间发表的学术论文64

【相似文献】

中国期刊全文数据库 前10条

1 谢贵武;杨继红;肖勇;闵刚;;基于语音分段的自适应时长调整算法[J];军事通信技术;2008年02期

2 樊建中;孙晴;杨永杰;;一种智能盲文学习机设计[J];现代电子技术;2010年05期

3 温洪昌;黄应强;傅贵兴;;单片机的多段语音组合录放系统设计[J];单片机与嵌入式系统应用;2011年10期

4 张剑;袁华强;;Rhetorical-State SVM在抽取式语音摘要中的应用[J];科学技术与工程;2013年21期

5 卢坚 ,毛兵 ,孙正兴 ,张福炎;一种改进的基于说话者的语音分割算法[J];软件学报;2002年02期

6 章文义,朱杰;几种无语音检测噪音估计方法的比较研究[J];计算机工程与设计;2003年10期

7 林鑫;陈桦;王开志;王继成;;语音驱动唇形自动合成算法[J];计算机工程;2007年17期

8 蔡铁;;基于在线单类支持向量机的自适应语音活动检测[J];深圳信息职业技术学院学报;2008年02期

9 章钊;郭武;;话者识别中结合模型和能量的语音激活检测算法[J];小型微型计算机系统;2010年09期

10 朱淑琴,裘雪红;一种精确检测语音端点的方法[J];计算机仿真;2005年03期

中国重要会议论文全文数据库 前9条

1 田野;王作英;陆大金;;基于韵律结构信息的非语音拒识[A];第六届全国人机语音通讯学术会议论文集[C];2001年

2 徐明;胡瑞敏;黄云森;;基于音素识别的语音评价方法[A];第二届和谐人机环境联合学术会议(HHME2006)——第15届中国多媒体学术会议(NCMT'06)论文集[C];2006年

3 王欢良;韩纪庆;李海峰;王承发;;面向嵌入式应用的小词汇量语音串识别系统[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年

4 那斯尔江·吐尔逊;吾守尔·斯拉木;麦麦提艾力;;维吾尔语大词汇量连续语音识别研究——语音语料库的建立[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年

5 简志华;王向文;;考虑帧间信息的语音转换算法[A];浙江省信号处理学会2012学术年会论文集[C];2012年

6 魏维;马海燕;;一种丢失语音信包重建的新算法[A];通信理论与信号处理新进展——2005年通信理论与信号处理年会论文集[C];2005年

7 陈凡;罗四维;;一个实用语音开发应用系统的设计与实现[A];第二届全国人机语音通讯学术会议论文集[C];1992年

8 刘红星;戴蓓劏;陆伟;;基于图像增强方法的共振峰谐波能量参数的语音和端点检测[A];第九届全国人机语音通讯学术会议论文集[C];2007年

9 林爱华;张文俊;王毅敏;;基于肌肉模型的语音驱动唇形动画[A];第十三届全国图象图形学学术会议论文集[C];2006年

中国重要报纸全文数据库 前5条

1 atvoc;数码语音电路产品概述[N];电子资讯时报;2008年

2 记者 李山;德用双音素改进人工语音表达[N];科技日报;2012年

3 中国科学院自动化研究所模式识别国家重点实验室 于剑邋陶建华;个性化语音生成技术面面观[N];计算机世界;2007年

4 江西 林慧勇;语音合成芯片MSM6295及其应用[N];电子报;2006年

5 ;与“小超人”对话[N];中国计算机报;2001年

中国博士学位论文全文数据库 前10条

1 高伟勋;智能家居环境中个性化语音生成关键技术研究[D];东华大学;2015年

2 陶冶;文本语音匹配的研究和应用[D];山东大学;2009年

3 何俊;声纹身份识别中非常态语音应对方法研究[D];华南理工大学;2012年

4 李冬冬;基于拓展和聚类的情感鲁棒说话人识别研究[D];浙江大学;2008年

5 双志伟;个性化语音生成研究[D];中国科学技术大学;2011年

6 古今;语音感知认证的关键技术研究[D];中国科学技术大学;2009年

7 彭波;Internet上语音的鲁棒性传输研究[D];华南理工大学;2001年

8 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年

9 应娜;基于正弦语音模型的低比特率宽带语音编码算法的研究[D];吉林大学;2006年

10 田立斌;语音通信质量客观评价、有效接收及错误恢复算法研究[D];华南理工大学;2004年

中国硕士学位论文全文数据库 前10条

1 王明明;基于GMM和码本映射相结合的语音转换方法研究[D];西安建筑科技大学;2015年

2 印雪晨;宋词朗读呼吸信号和韵律时长研究[D];西北民族大学;2015年

3 邱一良;噪声环境下的语音检测方法研究[D];电子科技大学;2015年

4 朱俊梅;基于性别预分类的年龄自动估计研究[D];江苏师范大学;2014年

5 张占松;基于DSP的语音干扰方法研究与实现[D];北京交通大学;2016年

6 李鹏;基于系统融合的语音查询项检索技术研究[D];解放军信息工程大学;2015年

7 赵蓉蓉;基于计算听觉场景分析的单通道语音盲分离技术[D];太原理工大学;2016年

8 周慧;基于PAD三维情绪模型的情感语音转换与识别[D];西北师范大学;2009年

9 李尘一;基于联合得分的语音置信度评估系统的研究与设计[D];内蒙古大学;2006年

10 朱君波;PCA在语音检测中的应用研究[D];浙江工业大学;2004年


  本文关键词:基于计算听觉场景分析的单通道语音盲分离技术,由笔耕文化传播整理发布。



本文编号:370752

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/370752.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c1d5c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com