基于SailAlign的中文语音文语对齐的研究
发布时间:2017-07-19 10:33
本文关键词:基于SailAlign的中文语音文语对齐的研究
更多相关文章: 文语对齐 SailAlign 语音识别 语言模型
【摘要】:文语对齐是以语音识别器为基础,在时间上对语音和文本进行强制对齐的过程。文语对齐通常被应用在多媒体检索和训练一个大词汇量的语音识别和合成系统。近年来网络上可以获取越来越丰富的音频资源,促进了语音和文本对齐的大规模研究。例如有声书本,多媒体文档等。对这些语音和文本,采用传统的基于维特比的强制对齐算法被证明对于文本和语音不匹配或者语音存在噪声的情况存在不足。为了使语音和文本能够避开这些限制,使用语音识别器对原始的语音进行识别,从而得到含有时间信息的识别文本,再把该文本与原始文本进行对齐,来得到两者共同的部分。这样就把语音和文本的对齐问题转化成为文本和文本的对齐问题,后一种问题的解决方案通常要求的计算量要少得多。SailAlign这一开源工具就是基于这种语音和文本对齐方法。本论文利用修改的SailAlign算法进行中文的文语对齐研究。在语音多于文本的情况下,我们进行了实验,并对其结果进行分析。最后我们还实现了自动化的文语对齐。本文的主要研究工作如下:首先,由于SailAlign算法不支持中文,所以我们修改了SailAlign的配置文件,并且添加了中文的语言模型和声学模型,从而能够使用SailAlign进行中文的文语对齐研究。声学模型和语言模型是用大量的新闻联播的语音和文本数据训练得到的,使用SailAlign算法对语音和文本进行文语对齐的过程是迭代的和自适应的。通过实验我们对SailAlign算法在语音多于文本的情况下进行文语对齐的正确率进行了分析和比较。实验表明,在语音多于文本的情况下,利用该算法得到的语音和文本进行对齐的正确率比较高。接下来我们通过SailAlign算法进行文语对齐以后,然后再把对齐的语音和文本数据分割出来,就可以得到一一对应的语音和文本。为了节省时间,提高效率,我们把SailAlign文语对齐的整个过程用一个shell脚本实现自动化,整个过程都是在Linux这一个平台下运行的。该自动化的文语对齐过程分为三个模块,分别为文本和语音的预处理,SailAlign的文语对齐,文本的抽取和语音的切分。
【关键词】:文语对齐 SailAlign 语音识别 语言模型
【学位授予单位】:中国海洋大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.34
【目录】:
- 摘要7-9
- Abstract9-13
- 1 引言13-21
- 1.1 语音识别发展历史13-16
- 1.2 语音识别系统介绍16-17
- 1.3 文语对齐的特点和研究现状17-19
- 1.4 本文研究的主要内容19
- 1.5 本文的组织结构19-21
- 2 基本原理和工具介绍21-29
- 2.1 HMM21-26
- 2.1.1 马尔科夫过程21
- 2.1.2 隐马尔可夫模型21-23
- 2.1.3 HMM基本要素及三个问题23-26
- 2.2 HTK26-28
- 2.3 本章小结28-29
- 3 各对应率下文语对齐的实验分析29-39
- 3.1 SailAlign30-35
- 3.1.1 编辑距离30-31
- 3.1.2 SailAlign介绍31-32
- 3.1.3 SailAlign算法32-35
- 3.2 实验结果和数据分析35-37
- 3.3 本章小结37-39
- 4 自动化的文语对齐39-49
- 4.1 文本与语音的预处理39-42
- 4.2 SailAlign的文语对齐42-45
- 4.3 文本的抽取和语音的切分45-46
- 4.4 自动化文语对齐46-48
- 4.5 本章小结48-49
- 5 总结与展望49-51
- 5.1 本文的主要工作49
- 5.2 对未来工作的展望49-51
- 参考文献51-56
- 致谢56-57
- 个人简历57
【相似文献】
中国期刊全文数据库 前1条
1 王者归来;;闭着眼睛“看”新闻——请来“文语通”为你读网页[J];电脑爱好者(普及版);2010年09期
中国硕士学位论文全文数据库 前3条
1 高红坤;基于SailAlign的中文语音文语对齐的研究[D];中国海洋大学;2015年
2 吴s,
本文编号:562474
本文链接:https://www.wllwen.com/kejilunwen/wltx/562474.html