当前位置:主页 > 科技论文 > 信息工程论文 >

语音合成系统中语音库样本能量均衡方法研究

发布时间:2018-04-10 19:10

  本文选题:语音合成 + 能量均衡 ; 参考:《信号处理》2017年02期


【摘要】:语音合成(Text to Speech,TTS)技术是实现人机语音通信的一项关键技术,语音库的质量是决定TTS效果的重要因素。本文针对TTS语音库制作周期长,发音人录音状态(音色、能量)差异而导致的TTS语音数据库录制后能量不一致问题,提出了一种语音能量均衡方法,包括时域包络波动检测和帧能量平均两个步骤。首先分析获得标准语音的相关能量参数和波动参数作为模板,利用时域包络波动检测算法对预调节语音样本的合格性进行检验;最后,根据帧能量平均准则,对所有合格语音样本进行时域幅值调整,以最大限度地保证语音库整体能量的一致性。实验结果表明,本文提出的语音能量均衡方法可以有效提升TTS语音库质量,具有实际工程意义。
[Abstract]:Speech synthesis (text to speech TTS) technology is a key technology in man-machine speech communication. The quality of speech base is an important factor to determine the effect of TTS.In this paper, a speech energy equalization method is proposed to solve the problem of energy inconsistency after recording in TTS speech database caused by long production period of TTS phonetic corpus and different phonetic recording states (timbre, energy).It includes two steps: time domain envelope wave detection and frame energy average.Firstly, the relevant energy parameters and fluctuation parameters of the standard speech are analyzed as templates, and the time-domain envelope wave detection algorithm is used to test the eligibility of the pre-adjusted speech samples. Finally, according to the frame energy average criterion,All the qualified speech samples are adjusted in time domain to maximize the consistency of the overall energy of the speech bank.The experimental results show that the proposed speech energy equalization method can effectively improve the quality of TTS speech corpus and has practical engineering significance.
【作者单位】: 电子科技大学通信抗干扰技术国家重点实验室;
【分类号】:TN912.33

【参考文献】

相关期刊论文 前3条

1 刘凤山;吕钊;张超;吴小培;;改进小波阈值函数的语音增强算法研究[J];信号处理;2016年02期

2 WU Di;ZHAO Heming;HUANG Chengwei;XIAO Zhongzhe;ZHANG Xiaojun;XU Yishen;TAO Zhi;;Speech endpoint detection in low-SNRs environment based on perception spectrogram structure boundary parameter[J];Chinese Journal of Acoustics;2014年04期

3 张勇;刘轶;刘宏;;结合人耳听觉感知的两级语音增强算法[J];信号处理;2014年04期

【共引文献】

相关期刊论文 前10条

1 刘伟;谢建志;;语音合成系统中语音库样本能量均衡方法研究[J];信号处理;2017年02期

2 韩伟;张雄伟;闵刚;张启业;;基于感知掩蔽深度神经网络的单通道语音增强方法[J];自动化学报;2017年02期

3 唐鹏;郭宝平;;改进型阈值函数寻优法的小波去噪分析[J];信号处理;2017年01期

4 魏莹;王双维;潘迪;张玲;许廷发;梁士利;;宽窄带语谱图融合分带投影的特定人汉语词汇识别[J];计算机科学;2016年S2期

5 张芝旖;姚恩涛;石玉;;小波分析和MFCC融合的声音信号端点检测算法[J];电子测量技术;2016年07期

6 章小兵;李燕萍;王双杰;;基于改进HHT的语音端点检测[J];计算机工程;2016年06期

7 覃贵礼;罗云芳;潘泽锴;;基于谱相减改进算法的语音增强系统的实现研究[J];河池学院学报;2016年02期

8 刘凤山;吕钊;张超;吴小培;;改进小波阈值函数的语音增强算法研究[J];信号处理;2016年02期

9 史小龙;李晓玲;高虹霓;韩枫;;全息显控界面中多通道人机交互技术研究[J];包装工程;2016年04期

10 叶琪;陶亮;周健;王华彬;;基于噪声谱约束的二值掩码估计语音增强算法[J];信号处理;2016年01期

【二级参考文献】

相关期刊论文 前10条

1 张勇;刘轶;刘宏;;结合人耳听觉感知的两级语音增强算法[J];信号处理;2014年04期

2 丁卫;王忠;;结合听觉掩蔽效应的时频自适应小波阈值增强[J];计算机工程与设计;2011年11期

3 章旭景;李辉;陆伟;;基于子带卡尔曼滤波的语音增强方法[J];信号处理;2009年09期

4 陈琪;郭英;张群;王布宏;;基于听觉感知的LSA-MMSE改进型语音增强方法[J];信号处理;2008年06期

5 赵晓群;黄小珊;;改进的基于人耳掩蔽效应谱减语音增强算法[J];通信学报;2008年09期

6 杨秋成;范炜玮;;基于先验信噪比估计的语音增强方法[J];信号处理;2008年02期

7 陶智,赵鹤鸣,龚呈卉;基于听觉掩蔽效应和Bark子波变换的语音增强[J];声学学报;2005年04期

8 卜凡亮,王为民,戴启军,陈砚圃;基于噪声被掩蔽概率的优化语音增强方法[J];电子与信息学报;2005年05期

9 陈振标,徐波;基于子带能量特征的最优化语音端点检测算法研究[J];声学学报;2005年02期

10 刘海滨,吴镇扬,赵力,曾毓敏;非平稳环境下基于人耳听觉掩蔽特性的语音增强[J];信号处理;2003年04期

【相似文献】

相关期刊论文 前10条

1 行人三;;利用离线语音库无阻碍学习英文[J];电脑迷;2013年11期

2 张文军,谢剑英,李 聪;语音库辅助建立工具的开发[J];计算机工程;2002年04期

3 石志熹,张文全;一种建立语音库的技术[J];山东电子;1996年04期

4 贾显锋;;气象语音库的制作及应用[J];广西气象;2005年S2期

5 朱玉玺;胡学骏;赵慧民;;基于数据驱动的语音库的分析与构建[J];电声技术;2006年05期

6 张巍;吴晓如;赵志伟;王仁华;;基于虚拟不定长的语音库裁剪方法[J];软件学报;2006年05期

7 张巍;吴晓如;刘江;王仁华;;语音库裁剪的一种不定长递阶聚类方法[J];计算机学报;2007年11期

8 赵剑;王丽荣;;基于三维可视语音库的发音康复方法[J];长春大学学报;2010年02期

9 吕强,吴娴,杨季文;一个汉字语音库的实现[J];苏州大学学报(自然科学);2001年01期

10 张巍;吴晓如;王仁华;;数据驱动方法的语音库裁剪研究[J];高技术通讯;2008年01期

相关会议论文 前7条

1 王侠;李明琴;肖熙;王作英;;电话语音库的设计与实现[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年

2 王侠;吴及;肖熙;王作英;;关于语音库建库若干问题的讨论[A];第六届全国人机语音通讯学术会议论文集[C];2001年

3 曲菲;黄泰翼;张希军;;汉语综合语音库语料设计[A];第四届全国人机语音通讯学术会议论文集[C];1996年

4 张巍;吴晓如;胡国平;王仁华;;语音库裁剪中的不定长处理[A];第八届全国人机语音通讯学术会议论文集[C];2005年

5 吕成国;周健;诸光;王承发;徐近霈;;高噪声有变异语音库的建立[A];第五届全国人机语音通讯学术会议论文集[C];1998年

6 李爱军;王天庆;殷治纲;;863语音识别语音语料库RASC863—四大方言普通话语音库[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年

7 张立华;杨莹春;;情感语音变化规律的实验分析研究初步[A];第九届全国人机语音通讯学术会议论文集[C];2007年

相关重要报纸文章 前1条

1 山东 黄家贞;让计算机开口说话[N];中国电脑教育报;2000年

相关硕士学位论文 前1条

1 庞敏辉;语音库自动构建技术的研究[D];中国海洋大学;2010年



本文编号:1732528

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1732528.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1bc8c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com