语音转换中特征参数及其转换方法的研究
[Abstract]:Speech conversion technology realizes the transformation between two different speakers' voice personality characteristics, that is, the target speaker's voice characteristics are oriented, and the source speaker's personality characteristics are changed to make it have the target speaker's characteristics. Thus, the auditory effect of the source speaker's voice is changed. In this paper, the conversion method of speech personality parameters is studied to realize the effective use of speech parameters and the enhancement of the conversion effects. The main work is as follows: (1) the adjustment of pitch frequency, speech speed and other prosodic characteristics is studied. In this paper, while realizing pitch frequency conversion, Gao Si method is proposed as the mapping rule of source and target speech time, and the target speech duration adjustment is realized by interpolation method according to the obtained timespan ratio. Thus, the synthesized speech time is closer to the target speech, and the similarity of speech speed is improved. (2) the conversion rules of vocal channel feature parameters are studied. The generalization attribute of artificial neural network is helpful to realize the transformation of speaker's feature, but the training of the network usually has the problem that there are many hidden layer nodes and the network structure is more complicated. Therefore, this paper presents a method of acoustic channel characteristic parameter conversion based on improved radial basis function neural network. In this method, K-means algorithm is used as the center value algorithm of neural network, and particle swarm optimization algorithm is used to optimize the number of nodes in the hidden layer of the network, which effectively improves the efficiency of fitting and converting the multi-dimensional nonlinear characteristic parameters of the radial basis function network. In order to improve the similarity between speech and target speech. (3) improve the speech conversion system. Because the extracted feature parameters usually have the characteristics of large amount of data, and for the same test speech to be converted, the conversion rules obtained by different data segment training have different conversion effects. In order to make full use of the extracted parameters, this paper proposes to preprocess a large number of feature parameters by Gao Si mixed model, and obtain the training parameters with small amount of data and strong characteristics. Therefore, on the basis of the improved neural network conversion algorithm, the feature parameter preprocessing module and the time length adjustment module are added to improve the speech conversion system and improve the quality of the converted speech.
【学位授予单位】:南京邮电大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.3
【相似文献】
相关期刊论文 前10条
1 黄仁;吴国章;程平;;基于特征参数在歌唱比赛评分方法中的研究[J];硅谷;2010年24期
2 黄明辉,虞仲龙,张志勇;一种在时级(频)域自动再生最佳特征参数的方法[J];振动.测试与诊断;1999年04期
3 冯晓亮;孟子厚;;面向普通话辅音检测的区别特征参数测量[J];声学技术;2010年03期
4 刘前军,常颖,李圭白;絮凝检测曲线特征参数的分析[J];传感器技术;2005年10期
5 肖威;马小愚;姜明;;稻米粒群特征参数的提取[J];农机化研究;2009年02期
6 杨军,,于云峰;使用捷联惯导的导弹自适应自动驾驶仪特征参数的选取方法[J];西北工业大学学报;1995年03期
7 张敏;张阳;;一种可撤除生物特征参数管理方案[J];西南民族大学学报(自然科学版);2013年04期
8 唐炜;王玉明;;复杂系统关键特征参数确定方法[J];信息与电子工程;2011年01期
9 陈爱军;李金宗;;一种基于几何特征参数的圆检测方法[J];计算机工程;2007年05期
10 孟祥豪;罗景青;;基于合成特征参数的雷达信号聚类分析[J];航天电子对抗;2011年06期
相关会议论文 前10条
1 杨大利;徐明星;吴文虎;;正交设计因子顺序对特征参数选择结果的影响[A];第六届全国人机语音通讯学术会议论文集[C];2001年
2 赵海天;向东;;城市灯光景观设计[A];全面建设小康社会:中国科技工作者的历史责任——中国科协2003年学术年会论文集(下)[C];2003年
3 徐慧;章斯宇;孟子厚;;普通话鼻韵母的分段参数化区分[A];第九届中国语音学学术会议论文集[C];2010年
4 祝明华;谢亦丰;熊连松;李琛;卓放;张海龙;;扰动条件下直流微型电网特征参数的实时在线计算方法[A];分布式发电、智能微电网与电能质量——第三届全国电能质量学术会议暨电能质量行业发展论坛论文集[C];2013年
5 涂群章;左洪福;;基于实时图像的固体污染物特征参数测量研究[A];首届信息获取与处理学术会议论文集[C];2003年
6 赵伟;黄永芳;叶序彬;胡本润;刘建中;陈立杰;;腐蚀坑特征参数与应力集中的相关性研究[A];第16届全国疲劳与断裂学术会议会议程序册[C];2012年
7 陈娜;樊瑾;王维;秦昊;文瑾;施心陵;;基于视频方式的颈椎康复功能监测[A];第二十七届中国控制会议论文集[C];2008年
8 郑冬红;孟子厚;;普通话平翘辅音区别特征参数的测量[A];中国声学学会2007年青年学术会议论文集(下)[C];2007年
9 王薇;杨震;;利用动态特征的语音转换系统性能研究[A];全国第三届信号和智能信息处理与应用学术交流会专刊[C];2009年
10 刘健刚;董静;;从符号学看标点在语音文本中的技术实现[A];2011'中国西部声学学术交流会论文集[C];2011年
相关重要报纸文章 前2条
1 任效良;科大科研成果填补国际空白[N];北方经济时报;2007年
2 燕海霞;王忆勤;李福凤;脉象信号研究日渐深入[N];中国医药报;2005年
相关硕士学位论文 前10条
1 张继光;脉搏特征参数与血压相关性研究[D];兰州理工大学;2009年
2 隋占菊;散射信道特征参数测量技术[D];西安电子科技大学;2009年
3 王岐学;基于统计特性的汉语方言辨识方法研究[D];湖南师范大学;2010年
4 于山山;基于心电信号的白天短时睡眠的分期研究[D];华东理工大学;2012年
5 刘建;特征参数模式比对在语音评分中的应用研究[D];中南大学;2009年
6 严晓燕;纤维的包埋切片技术与异形纤维特征参数研究[D];东华大学;2006年
7 陈先同;语音转换中特征参数及其转换方法的研究[D];南京邮电大学;2015年
8 吴国章;基于特征参数的歌唱评分方法研究[D];重庆大学;2011年
9 王厚英;病态嗓音特征参数的优化研究[D];广西师范大学;2015年
10 王海;多缸柴油机各缸一致性特征参数研究[D];西华大学;2014年
本文编号:2284624
本文链接:https://www.wllwen.com/kejilunwen/wltx/2284624.html