最大熵软决策树HMM最大似然藏语音合成
本文关键词: 软决策树 藏语音合成 隐式马尔可夫 最大熵 隶属度 出处:《计算机工程与设计》2017年04期 论文类型:期刊论文
【摘要】:针对传统的硬决策树藏语音合成系统存在泛化性能不强的问题,设计改进一种二进制软决策树算法,实现基于语境因子的藏语音合成模型参数估计。内部节点根据子代节点隶属度进行选取,每个节点可视为基于语境依赖隶属度的模糊集合,将每个语境分配给几个重叠的叶节点,提高模型概括和函数逼近性能;采用最大熵平滑分布进行局部一阶矩和全局二阶矩特征捕捉,实现隐式马尔可夫(HMM)输出概率分布的软决策参数最大似然估计。仿真验证结果表明,所提算法在满足应用实时性要求的前提下,可有效提高藏语音合成效果。
[Abstract]:Aiming at the problem of poor generalization performance in traditional hard decision tree Tibetan speech synthesis system, a binary soft decision tree algorithm is designed and improved. The parameter estimation of Tibetan speech synthesis model based on context factor is realized. Each node can be regarded as a fuzzy set based on context-dependent membership degree. Each context is assigned to several overlapping leaf nodes to improve the performance of model generalization and function approximation. The maximum likelihood estimation of the output probability distribution of implicit Markov HMMs is realized. The simulation results show that the proposed algorithm can effectively improve the performance of Tibetan speech synthesis.
【作者单位】: 西藏大学藏文信息技术研究中心;
【基金】:教育部人文社会科学研究青年基金项目(15YJC740063);教育部人文社会科学研究西藏基金项目(15XZJCZH001) 西藏大学青年科研培育基金项目(ZDPJZK1505);西藏大学珠峰学者人才发展支持计划主体计划“杰出青年学者”的自助 国家社会科学研究重大项目“基于地理信息平台的藏语方言数据库建设”(14ZDB101)之子课题“藏语方言时空数据库建设”
【分类号】:TN912.33
【相似文献】
相关期刊论文 前10条
1 周海涛;;语音合成中多音字识别的实现[J];科技资讯;2008年11期
2 彭腾;孙萍;;基于C#语音合成的实现[J];电脑编程技巧与维护;2010年12期
3 张世平;;会说四种话的语音合成卡——声威一号[J];今日电子;1993年01期
4 赵建洋;;一种高效语音合成方法[J];电子技术;1993年08期
5 马义德,,张新国,罗长印;语音合成电路在我国的应用前景[J];电子技术;1994年12期
6 郝杰;语音合成:引领“耳朵经济”[J];中国电子商务;2001年Z2期
7 罗三定,贾建华,沙莎;基于波形音频段处理的中文语音合成研究[J];电脑与信息技术;2002年01期
8 ;国内语音合成领域专利技术发展趋势[J];电子知识产权;2003年10期
9 周洁,赵力,邹采荣;情感语音合成的研究[J];电声技术;2005年10期
10 王永生;柴佩琪;曾令平;;英语语音合成中基于约束树的音节切分算法[J];微型电脑应用;2005年11期
相关会议论文 前10条
1 杨静;孙金城;;关于录制语音合成数据库的几个问题[A];中国声学学会2002年全国声学学术会议论文集[C];2002年
2 徐俊;蔡莲红;吴志勇;;多语种语音合成平台的设计与实现[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
3 陈益强;高文;王兆其;杨长水;姜大龙;;多模式语音合成[A];第六届全国人机语音通讯学术会议论文集[C];2001年
4 陶建华;董宏辉;许晓颖;;情感语音合成的关键技术分析[A];第六届全国现代语音学学术会议论文集(下)[C];2003年
5 刘东华;冯静;力梅;;深圳市新一代“12121”语音合成业务系统[A];中国气象学会2007年年会气象软科学论坛分会场论文集[C];2007年
6 黄小明;熊子瑜;;基于古音系统的汉语方言语音合成研究[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年
7 邹煜;何伟;侯敏;滕永林;朱维彬;;面向语音合成的新闻播报语音库构建及其特殊韵律结构[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
8 贺琳;张蕊;俞舸;;大规模语音合成语料库的录制及常见问题[A];中国声学学会2002年全国声学学术会议论文集[C];2002年
9 陶建华;康永国;;基于多元激励的高质量语音合成声学模型[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
10 吴志勇;蔡莲红;蒙美玲;;可视语音合成中基于音视频关联模型的视位参数优化[A];第八届全国人机语音通讯学术会议论文集[C];2005年
相关重要报纸文章 前10条
1 记者 桂运安;中科大11项语音合成指标世界第一[N];安徽日报;2014年
2 本报记者 何进伟;语音合成露峥嵘[N];网络世界;2001年
3 李羚;多语种语音合成助力数字奥运[N];中国计算机报;2003年
4 清华大学计算机系人机交互与媒体集成研究所 陶建华 蔡莲红;语音合成的应用系统设计[N];计算机世界;2001年
5 ;嵌入式语音合成平台[N];计算机世界;2002年
6 孙晓闻;语音合成 让机器“像人一样说话”[N];中国劳动保障报;2005年
7 ;新型语音合成软件面世[N];人民邮电;2008年
8 炎黄新星公司供稿;炎黄之声SinoSonic[N];计算机世界;2002年
9 刘权;语音合成融入证券客服[N];中国计算机报;2003年
10 ;语音产品走向开放式架构[N];中国计算机报;2004年
相关博士学位论文 前10条
1 高莹莹;面向情感语音合成的言语情感建模研究[D];北京交通大学;2016年
2 高裴裴;人眼驱动语音合成的若干关键技术研究[D];南开大学;2012年
3 赵晖;真实感汉语可视语音合成关键技术研究[D];国防科学技术大学;2010年
4 苏庄銮;情感语音合成[D];中国科学技术大学;2006年
5 卢恒;基于统计模型与发音错误检测的语音合成方法研究[D];中国科学技术大学;2011年
6 雷鸣;统计参数语音合成中的声学模型建模方法研究[D];中国科学技术大学;2012年
7 蔡明琦;融合发音机理的统计参数语音合成方法研究[D];中国科学技术大学;2015年
8 凌震华;基于统计声学建模的语音合成技术研究[D];中国科学技术大学;2008年
9 杨辰雨;语音合成音库自动标注方法研究[D];中国科学技术大学;2014年
10 尉洪;汉语基元音素独立分量谱分析对比及语音合成研究[D];云南大学;2011年
相关硕士学位论文 前10条
1 王泽勋;多层次韵律和短时谱同步变换的情感语音合成[D];苏州大学;2015年
2 熊林云;基于ARM Cortex-M3的语音合成软件系统设计与实现[D];电子科技大学;2014年
3 章琴;基于HMM的中文情感语音合成的研究[D];合肥工业大学;2014年
4 李冰洁;基于声韵母的嵌入式语音合成[D];北京交通大学;2016年
5 李焕君;个性化语音合成在船舶导航系统中应用研究[D];大连海事大学;2016年
6 冯欢;基于HMM的歌词到歌声转换的研究[D];西北师范大学;2015年
7 王海燕;汉藏双语跨语言统计参数语音合成的研究[D];西北师范大学;2015年
8 孙晓辉;结合听感度量的语音合成方法研究[D];中国科学技术大学;2016年
9 李翔凰;基于HMM-RBM的蒙古语语音合成研究[D];内蒙古大学;2016年
10 王雨蒙;英语文语转换系统中的ToBl韵律自动标注方法与实现[D];云南大学;2016年
本文编号:1543240
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1543240.html