基于自组织聚类和改进粒子群算法的语音转换方法
[Abstract]:A speech conversion method based on self-organizing clustering and using improved particle swarm optimization (PSO) to determine the parameters of transformation model is proposed. In this method, the feature parameters are clustered based on the self-organizing feature mapping network, then the transformation rules are established for each cluster, and the model parameters of each transformation rule are determined by the particle swarm optimization algorithm of Cauchy mutation. Compared with the traditional single transformation rule, the multi-transformation rule established after clustering and using improved particle swarm optimization algorithm to determine the parameters can improve the accuracy of the mapping relationship and avoid the parameter falling into the local optimal point. Taking the female voice to male voice as an example, the subjective test shows that the similarity between the converted speech and the target is increased by 27.6%, and the average subjective opinion score (Mean Opinion Score,MOS) is increased by 0.6. The objective test also shows that the spectral distortion of this method is the least. Closer to the envelope of the target.
【作者单位】: 南京邮电大学通信与信息工程学院;
【基金】:国家自然科学基金(60872105) 江苏省“青蓝工程”中青年学术带头人课题 江苏高校优势学科建设工程项目(PAPD)资助
【分类号】:TN912.3
【参考文献】
相关期刊论文 前6条
1 左国玉,刘文举,阮晓钢;声音转换技术的研究与进展[J];电子学报;2004年07期
2 吴艳;刘重阳;廖桂生;;一种新的像素级多聚焦图像融合算法[J];电子与信息学报;2007年12期
3 朱泉同;张建伟;陈允杰;;基于高斯混合模型的人脑MR图像分割新算法研究[J];计算机应用与软件;2009年03期
4 李波,王成友,蔡宣平,唐朝京,张尔扬;语音转换及相关技术综述[J];通信学报;2004年05期
5 张焱,姜惠春,黄志同;隐马尔可夫模型和动态时间现正统一框架下的汉语全音节语音识别研究[J];声学学报;1998年06期
6 康永国;双志伟;陶建华;张维;;基于混合映射模型的语音转换算法研究[J];声学学报;2006年06期
【共引文献】
相关期刊论文 前10条
1 李仁和;;一种新的多传感器彩色图像融合方法[J];传感器与微系统;2010年05期
2 杨栩;尤学一;季民;潘留明;王秀朵;赵乐军;;城市绿地土壤入渗模型及参数确定[J];城市环境与城市生态;2011年06期
3 李燕楠;包广清;;基于小波包和支持向量机的电能质量扰动识别[J];电力科学与工程;2012年03期
4 张剑;戴蓓劏;孙俊;陆伟;李辉;;基于分类线性加权的源-目标话者声音转换算法的研究[J];电路与系统学报;2008年03期
5 张照坤;;语音转换关键技术研究[J];电脑知识与技术;2008年07期
6 钱开华;;基于音素HMM模型语音转换[J];电脑知识与技术;2008年10期
7 夏菁,尹俊勋,黄建成,黄锋;基于正弦加噪声模型的说话人转换方法[J];电声技术;2005年02期
8 符敏;程德福;;支持向量回归在声音转换中的应用[J];电声技术;2006年03期
9 何峰;于东武;林嘉宇;;一种语音更改技术的研究与实现[J];电声技术;2007年02期
10 孙卓;岳振军;;一种汉语语音变换技术[J];电声技术;2007年06期
相关会议论文 前10条
1 ;Particle Swarm Optimization of Periodic Deep Brain Stimulation Waveforms[A];中国自动化学会控制理论专业委员会A卷[C];2011年
2 岳振军;王浩;张雄伟;;基于正弦谐波模型和BP神经网络的语音变换算法及实现[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
3 王薇;杨震;;基于GMM的语音转换系统性能研究[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
4 ;Hybrid particle swarm optimization-simplex algorithm for inverse problem[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
5 ;A Modified Glowworm Swarm Optimization for Multimodal Functions[A];Proceedings of the 2011 Chinese Control and Decision Conference(CCDC)[C];2011年
6 王薇;杨震;;利用动态特征的语音转换系统性能研究[A];全国第三届信号和智能信息处理与应用学术交流会专刊[C];2009年
7 刘金凤;符敏;程德福;;声音转换实验系统的研究与实现[A];2005全国自动化新技术学术交流会论文集(三)[C];2005年
8 康永国;双志伟;陶建华;张维;徐波;;高斯混合模型和码本映射相结合的语音转换算法[A];第八届全国人机语音通讯学术会议论文集[C];2005年
9 马建春;刘文举;;基于共振峰和高斯混合模型的声音转换系统[A];第八届全国人机语音通讯学术会议论文集[C];2005年
10 符敏;程德福;张广峰;;基于支持向量回归的声音转换[A];第八届全国人机语音通讯学术会议论文集[C];2005年
相关博士学位论文 前10条
1 夏益民;基于传感器信息融合的移动机器人定位与地图创建研究[D];广东工业大学;2011年
2 贺伟凇;骨干网络流量异常行为感知方法研究[D];电子科技大学;2011年
3 张萍;基于群智能优化的运动估计算法研究[D];电子科技大学;2011年
4 李奇;质子交换膜燃料电池系统建模及其控制方法研究[D];西南交通大学;2011年
5 张晴;基于样本的数字图像修复技术研究[D];华东理工大学;2012年
6 孙俊;基于激励源及其韵律特征的源—目标说话人声音转换研究[D];中国科学技术大学;2006年
7 林琳;基于模糊聚类与遗传算法的说话人识别理论研究及应用[D];吉林大学;2007年
8 郑向伟;求解优化问题的微粒群算法及其应用研究[D];山东师范大学;2008年
9 杨凤芹;基于粒子群的优化方法研究[D];吉林大学;2009年
10 赵亮;基于协同PSO算法的模糊辨识与神经网络学习[D];上海交通大学;2009年
相关硕士学位论文 前10条
1 梁毅;粒子群算法搜索模式研究与应用[D];华东理工大学;2011年
2 杨维;微粒群优化算法及其在风资源评估中的应用[D];华东理工大学;2011年
3 毛婧敏;基于离散量子微粒群优化算法的车间生产调度研究[D];浙江大学;2011年
4 裴璐乾;SAR、红外、可见光图像配准及融合算法研究[D];西安电子科技大学;2011年
5 魏丽;群体动画中运动生成模块的模型研究[D];山东师范大学;2011年
6 梁宵;地下矿床开拓系统空间优化的粒子群方法[D];武汉理工大学;2011年
7 汪华;粒子群算法的研究及其在供水优化调度中的应用[D];合肥工业大学;2011年
8 李传健;计及负荷和风力发电随机变化的配电网重构研究[D];华南理工大学;2011年
9 陈燕潘;密集环境下RFID读写器组网关键技术研究[D];电子科技大学;2011年
10 王娜;基于语音识别的机器人控制技术的研究[D];东北石油大学;2011年
【二级参考文献】
相关期刊论文 前7条
1 左国玉,刘文举,阮晓钢;声音转换技术的研究与进展[J];电子学报;2004年07期
2 张建伟;夏德深;;高斯混合模型改进的活动轮廓模型MRI分割[J];计算机辅助设计与图形学学报;2005年12期
3 高尚,杨静宇,吴小俊,刘同明;基于模拟退火算法思想的粒子群优化算法[J];计算机应用与软件;2005年01期
4 马明,张杰,王建宇,黄志同;语音识别中隐马尔可夫模型初值的估计[J];数据采集与处理;1997年02期
5 朱周华;期望最大(EM)算法及其在混合高斯模型中的应用[J];现代电子技术;2003年24期
6 张焱,姜惠春,黄志同;隐马尔可夫模型和动态时间现正统一框架下的汉语全音节语音识别研究[J];声学学报;1998年06期
7 李淑红,桑恩方;基于小波变换和矢量量化的语音压缩编码方案[J];声学学报;2000年01期
相关会议论文 前1条
1 初敏;;韵律研究与合成语音的自然度[A];新世纪的现代语音学——第五届全国现代语音学学术会议论文集[C];2001年
【相似文献】
相关期刊论文 前10条
1 孙俊;戴蓓劏;张剑;;基于基元段特征和GMM的源-目标说话人F_0~t转换[J];信号处理;2007年02期
2 ;DutchView新转播车配备艾崧的“神经元”[J];现代电视技术;2011年09期
3 王海祥;;基于RBF神经网络的源——目标话音转换[J];电子测量技术;2006年06期
4 王丽;;改进神经网络模型对通信网可靠性的预测[J];计算机工程与应用;2010年22期
5 李静芳;张江伟;崔霞霞;;CPSN在信道均衡中的应用[J];无线电工程;2006年05期
6 张爱云;卢兴亚;;浅谈数字音频文件格式及其转换应用[J];电脑知识与技术;2009年26期
7 周德全,张富良,刘国岁;基于ASOM神经网络的高分辨雷达目标识别[J];现代雷达;1999年03期
8 杨云升;刘万洪;王胜涛;;线性神经网络在语音干扰效果评估中的应用[J];电声技术;2008年11期
9 王东斌;孙海波;;基于人工神经网络的信号分析处理[J];科技信息;2009年33期
10 马昕,袁信;基于神经元的容错组合导航系统设计[J];宇航学报;1999年02期
相关会议论文 前10条
1 姚艳军;景新幸;;一种基于STRAIGHT模型的语音转换方法[A];中国声学学会2009年青年学术会议[CYCA’09]论文集[C];2009年
2 王薇;杨震;;基于GMM的语音转换系统性能研究[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
3 江源富;黄泰翼;;一种基于词的统计属性模型的语音-文本转换方法[A];第二届全国人机语音通讯学术会议论文集[C];1992年
4 李丹;毕经平;;一种用于NAT-PT的SIP ALG的设计和实现[A];2008通信理论与技术新发展——第十三届全国青年通信学术会议论文集(下)[C];2008年
5 李飞;董小亮;赵生妹;郑宝玉;;基于量子神经网络的CDMA多用户检测方案[A];通信理论与信号处理新进展——2005年通信理论与信号处理年会论文集[C];2005年
6 邵兰;;VOIP在MSAN中实现的NAT技术[A];武汉市第二届学术年会、通信学会2006年学术年会论文集[C];2006年
7 徐小峰;俞一彪;;基于说话人独立建模的语音转换系统研究[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
8 杨明;刘泽民;;一种基于NN的ATM网络双重路由选择算法[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
9 曹文明;叶虹;徐春燕;王守觉;;基于双权值神经网络的数字语音识别研究[A];2005中国控制与决策学术年会论文集(下)[C];2005年
10 沈小马;;东北天坐标系下的时差体制被动雷达精度分析[A];四川省电子学会雷达与火控、电子线路与系统专业委员会学术交流会10周年优秀论文集[C];2006年
相关重要报纸文章 前1条
1 刘杰;综合结算 在IA64平台上进行[N];中国计算机报;2004年
相关博士学位论文 前10条
1 吕声;说话人转换方法的研究[D];华南理工大学;2004年
2 孙俊;基于激励源及其韵律特征的源—目标说话人声音转换研究[D];中国科学技术大学;2006年
3 张力宁;点云数据抗噪处理方法及其在叶片重建中的应用研究[D];西北工业大学;2006年
4 尚丽;稀疏编码算法及其应用研究[D];中国科学技术大学;2006年
5 王q,
本文编号:2448776
本文链接:https://www.wllwen.com/kejilunwen/wltx/2448776.html