维吾尔语连续语音流中音素的自动切分算法研究与实现

发布时间：2022-02-20 20:59

　　语料库的建设是语音信息处理的基础工作,其中除了在语料收集和录音等方面做大量工作外,做准确的标注也是建立完善语料库的必要工作,因为这直接影响语音处理工作的结果。本文就以建立维吾尔语音语料库为目的,为了减少人工工作量,提高标注准确率,结合维吾尔语语音特征,通过HTK工具实现了基于单音素HMM模型的自动切分算法和基于三音素HMM模型的自动切分算法。其中完成了文本设计、录音、手动标注、音素列表的确定、上下文属性集与问题集的设计、带时间标注文件与不带时间的上下文相关标注文件的生成等数据准备工作;研究HMM和HTK的用法,配置适合维吾尔语音素级自动切分的HMM拓扑结构,通过训练得到单音素模型和三音素模型,对任意输入的语音句子自动切分,最后分析了两种算法的切分准确度、存在的问题及对策等。实验结果证明基于三音素HMM模型的自动切分准确率高于基于单音素模型的自动切分准确率。

【文章来源】：新疆大学新疆维吾尔自治区211工程院校

【文章页数】：60 页

【学位级别】：硕士

【文章目录】：
摘要
Abstract
第一章绪论
    1.1 课题研究背景及意义
        1.1.1 课题背景
        1.1.2 研究意义
    1.2 语音自动切分技术的研究现状
        1.2.1 人工切分方法
        1.2.2 基于HMM 的自动切分方法
        1.2.3 基于DTW 的自动切分方法
        1.2.4 其他方法及总结
    1.3 本文的研究内容及安排
第二章语音自动切分的相关技术
    2.1 语音切分单元的选取
    2.2 模型训练和匹配技术
    2.3 HMM 简介
        2.3.1 HMM 基本概念
        2.3.2 HMM 的三个基本问题
    2.4 HTK 工具简介
第三章维吾尔语连续语音流中音素的自动切分算法研究和实现
    3.1 维吾尔语语音学基础
        3.1.1 音素和音节
        3.1.2 元音和辅音
    3.2 维吾尔语语音自动切分基元的选取
    3.3 数据准备
        3.3.1 文本语料的收集与挑选
        3.3.2 语音语料的设计与录音
    3.4 基于单音素HMM 模型的音素自动切分算法
        3.4.1 自动切分流程
        3.4.2 模型参数配置
        3.4.3 音素列表的确定
        3.4.4 带时间的标注文件
        3.4.5 单音素模型的初始化和训练
        3.4.6 音素自动切分
    3.5 基于三音素HMM 模型的音素自动切分算法
        3.5.1 自动切分流程
        3.5.2 上下文属性的设计
        3.5.3 问题集的设计
        3.5.4 不带时间的上下文相关标注文件
        3.5.5 上下文相关模型的训练
        3.5.6 音素自动切分
第四章实验结果与分析
    4.1 实验结果
    4.2 存在的问题及其对策
第五章总结与展望
    5.1 总结
    5.2 展望
参考文献
在研期间发表论文及参与课题
致谢

【参考文献】：
期刊论文
[1]BP人工神经元网络与汉语语音的音节切分[J]. 胡瑞敏,薛东辉,姚天任,黄铁侠.  华中理工大学学报. 1996(S2)

博士论文
[1]基于隐马尔科夫模型的语音合成技术研究[D]. 吴义坚.中国科学技术大学 2006

硕士论文
[1]面向语音合成的维吾尔语韵律层级自动标注算法研究[D]. 努尔比娅·塔依尔.新疆大学 2010
[2]HMM在基于参数的语音合成系统中的应用[D]. 杜嘉.上海交通大学 2008
[3]基于HMM的维吾尔语音合成系统的研究与实现[D]. 艾斯卡尔·肉孜.新疆大学 2008
[4]方言口音普通话语音自动切分算法研究[D]. 杜守栓.中国科学院研究生院（计算技术研究所） 2006

本文编号：3635795

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/wenyilunwen/yuyanyishu/3635795.html

上一篇：组形·借代·衬托 ——写作学思维下的象形字法学研究
下一篇：对越初级阶段汉语生词课堂教学设计

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|