语音时长规整与变调技术研究
本文关键词: 语音时长规整 WSOLA算法 语音变调 同态处理 GUI处理平台 出处:《兰州交通大学》2015年硕士论文 论文类型:学位论文
【摘要】:语音信号处理技术与计算机科学、模式识别系统、人工智能等领域与技术密切相关,融合了语言学研究与信号处理技术,对语音信号处理技术的研究会推动相关技术的发展。例如,随着人机交互的不断发展,以语音为通道的人机交互环境将会成发展的热点和主流,语音环境下的交互方式将极大地提高人机交互的自然性和高效性。因此,对语音信号处理技术的深入研究具有重要的理论与实践意义。语音信号处理技术可以分语音的合成、编码以及识别三大类,本文就其中的语音合成技术中语音更改部分的内容:语音时长规整和语音变调技术做重点研究。语音时长规整即在不改变说话人基频、音色等特征下实现对语音时长的改变;语音变调技术则是在不改变说人语音速度的情况下实现对说话人基频的改变。在实践中,语音时长规整和语音变调技术可广泛应用于语音压缩、传输通信、外语教学、影视后期制作及文语转换等众多领域。文章首先概要地阐述了该论文所研究内容的背景、意义,并对语音时长规整与变调技术的主要方法和国内外研究进展做出介绍。其次,研究和阐述了语音信号产生的物理机制,基于其物理机制详细分析了语音信号的经典数字模型。在此基础上,对于语音时长规整技术,详细介绍了典型算法OLA、SOLA、WSOLA以及基于模型的线性预测法等算法的原理及实现方法,并进行仿真对比实验。针对WSOLA算法在进行规整时采用统一规整而没有根据语音的感知特性做出相应的区分,因而在采样率偏低或者整体规整比例偏大的情况下规整效果将会变差的缺陷,分析了人耳的听觉预测原理,提出基于人耳听觉预测的改进WSOLA时长规整算法,对人耳感知敏感的转折区语音进行了保留,提高了输出语音的规整质量。进一步针对改进算法带来的规整比例误差提出一种动态时间规整补偿算法,有效地使改进算法在提高感知度的情况下,保证了规整时长的准确性。对于语音变调技术,分析推导了基于时域重采样方法结合语音时长规整的算法、基于线性预测的方法等算法,并进行仿真对比实验。应用线性重采样结合基于人耳听觉预测的改进WSOLA时长规整算法获得了很好变调效果的语音。另一方面,针对声门激励信号的模拟和声道共振峰模型的准确提取两方面,提出基于同态滤波倒谱域处理的方法。用倒谱方法提取人声元音信号进行周期拓展和重采样,得到根据规整需求改变基音周期的声门模拟激励,用同态解卷方法提取声道传输函数并用线型比例的重采样方法得到改变共振峰频率的声道传输函数,有效地实现了保证语音时长不变的情况下对语音的变调处理,提高了合成语音的自然度。最后构建基于Matlab的GUI语音信号处理平台,把对语音时长规整与变调技术的各研究算法集成起来,使处理结果直观呈现。该平台能完成对本地或现场录制语音按用户规整意愿进行语音变速不变调、语音变调不变速以及变速变调的调整,实时显示出规整后语音的波形及频谱。并通过快捷键的功能加入,可快捷实现男声变女声、女声变男声等变换,保存功能使用户能对规整后的语音进行保存。
[Abstract]:In this paper , the theory and realization method of speech signal processing technology are discussed in detail . The speech signal processing technology can be widely used in speech compression , transmission communication , foreign language teaching , movie post - making and text conversion . the platform can complete the adjustment of voice transmission without modulation , voice modulation and variable speed adjustment on local or on - site recording voice according to the user ' s regular will , display the waveform and frequency spectrum of the regular voice in real time , and can quickly realize the transformation of the male voice , the female voice and the male voice through the function of the shortcut key , so that the user can save the regular voice .
【学位授予单位】:兰州交通大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.3
【相似文献】
相关期刊论文 前10条
1 杨立东;;“语音信号处理”课程的教学改革[J];科技资讯;2008年28期
2 赵力;;“语音信号处理”课程改革与实践[J];电气电子教学学报;2010年04期
3 吕丹桔;徐伟恒;;《语音信号处理》课程改革[J];电脑知识与技术;2010年25期
4 许丽群;马驰;王睿杰;;时频分析在语音信号处理中的应用[J];科学技术与工程;2011年21期
5 杨毅;邓北星;马晓红;;《语音信号处理》实验教学研究与实践[J];实验科学与技术;2012年06期
6 程启明,,张礼和;通用语音信号处理系统的实现[J];声学技术;1994年03期
7 赵力;;语音信号处理嵌入式教学实验平台的研究与开发[J];信息化研究;2014年01期
8 赵力;;对语音信号处理课程改革的探索[J];时代教育(教育教学);2010年03期
9 赵力;;搞好语音信号处理课程教学的几点体会[J];时代教育(教育教学);2010年10期
10 ;2001年多媒体、视频和语音信号处理国际会议征文通知[J];数据采集与处理;2000年03期
相关会议论文 前9条
1 梁瑞宇;奚吉;张学武;;压缩感知理论在语音信号处理中的应用[A];2010’中国西部声学学术交流会论文集[C];2010年
2 卢化;岳东剑;柴佩琪;;语音信号处理技术用于评定口腔手术效果[A];第二届全国人机语音通讯学术会议论文集[C];1992年
3 杨立志;苏文忠;;语音信号处理工作平台[A];第三届全国人机语音通讯学术会议论文集[C];1994年
4 郑能恒;王新龙;;非线性语音信号处理的初步研究[A];中国声学学会2002年全国声学学术会议论文集[C];2002年
5 王建波;林本浩;田春明;;软计算方法在语音信号处理中的应用[A];2009年中国智能自动化会议论文集(第一分册)[C];2009年
6 陈文钢;田岚;姜晓庆;;基于语音卡的语音信号处理平台的设计与实现[A];2006中国控制与决策学术年会论文集[C];2006年
7 王波;王炳锡;王杰锋;;小波变换和希尔伯特变换在语音信号处理中的应用[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
8 高文;闫宝杰;张晶;;一种开放型通用语音信号处理平台——EOGI[A];第三届全国人机语音通讯学术会议论文集[C];1994年
9 张延平;尹建琪;陈锡先;;通用语音信号处理系统——BYDSP-C30[A];第三届全国人机语音通讯学术会议论文集[C];1994年
相关博士学位论文 前3条
1 何培宇;面向实时处理的自适应声学语音信号处理[D];四川大学;2005年
2 申丽然;Hilbert-Huang变换及其在含噪语音信号处理中的应用研究[D];哈尔滨工程大学;2006年
3 汪林;多通道语音信号处理中的关键技术研究[D];大连理工大学;2010年
相关硕士学位论文 前10条
1 雷颖思;语音时长规整与变调技术研究[D];兰州交通大学;2015年
2 郭伟;基于听觉神经原理的语音信号处理[D];上海交通大学;2009年
3 张海涛;车载通信控制系统的语音信号处理研究与实现[D];华中科技大学;2005年
4 王光艳;语音信号处理中的数学形态学方法研究[D];河北工业大学;2003年
5 付维勇;基于小波变换的语音信号处理的应用研究[D];昆明理工大学;2008年
6 张维强;小波分析及其在语音信号处理中的应用[D];西安电子科技大学;2000年
7 张力;基于DSP的语言信号采集与处理系统设计与实现[D];西南交通大学;2004年
8 杨传森;IP电话语音信号处理、传送系统的研制[D];河海大学;2003年
9 尹利民;基于DSP无线通信中的语音信号处理研究[D];武汉科技大学;2008年
10 王洁丽;数学形态学在语音信号处理中的应用[D];河北工业大学;2006年
本文编号:1495503
本文链接:https://www.wllwen.com/kejilunwen/wltx/1495503.html