基于音素的语音可懂度评价方法的研究与实现
【学位授予单位】:北京工业大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TN912.3
【图文】:
并对各分类模型在语音识别中的拓展应用进行了简究所可能存在的问题以及为后续章节的研究工作做铺垫。别技术识别技术的计算机辅助发音系统(CAPT),其核心技术就,由于英语作为全球最广为流通以及普遍的语言,其学习者算机辅助英语学习也成为了当今的一大研究热点。英文发多种技术来进行研究,研究首先需要了解英语语音的一些基理学过程,并据此建立合理的模型来描述发音检测评价的过类的产生与三部分器官有关:肺部、喉咙和声道。经过声道成人们所能听到的语音。例如英文单词“breakfast”的产生st 的音强图和声谱图。
音素,字母,音标都是衡量一个英语学习中的发音质量以及能否被听者正确听懂理解的重要依据。2.1.2 语音信号处理语音声学基元是声学模型构建的基础,声学基元的选择标准一般需要考虑三个标准易训练、可拓展以及高精度。目前语音识别研究中声学基元的选择大多都是词(word)、音节(syllable)、半音节(semi-syllable)以及音素(phone)等。英文语音一般选择音素作为声学基元,对于小词汇语音识别系统,通常声学基元为词。由于构成英文单词的单元是字母,而字母又是音素组成的。而与汉语的词汇发音不同,汉语大多是基于声母,韵母所构成的[25][26]。计算机首先将接收到的语音进行预处理操作,处理为语音信号之后才能进行分析。通过计算机进行预处理等操作,可以一定程度上减少因为人类本身和采集设备对语音信号质量所造成的影响。为之后的信号处理提供稳定,优质的分析参数,从而提高信号处理的质量。语音信号处理流程如图 2-2 所示。
态序列不能被直接观察到,但可以通过观察向量反映出来;对于任意给定状态,MM 模型又是一个由隐含状态决定观察值的随机过程,它会以随机概率输出相的观察向量。HMM 的随机过程与语音的形成过程类似。HMM 模型能够很好的模拟语音特性,并对应出合理的数学解析,且对随时间不断变化的语音信号有极强的建能力。HMM 模型可以用以下五组参数来进行描述,如公式 2-1 所示: { , , , , } (2-1)其中 表示 HMM 模型所包含的有限隐含状态的集合; 表示每个隐状态所组的集合; 表示状态之间的转移概率,可用一个矩阵来表示; 为相应输出观察的概率; 表示由系统初始状态概率所构成的集合。HMM 模型用作声学模型,图 2-3 为 HMM 的示意图,其具有 6 个状态的 Morkov 过程,状态 2┼5 代表间状态,两个黑圆圈分别代表入口状态 1 和出口状态 6。
【相似文献】
相关期刊论文 前10条
1 陈亚繁;许勇;杨军;;单通道语音增强对低信噪比汉语可懂度的影响[J];电声技术;2016年10期
2 陈惠德;;%AL_cons的测试[J];电声技术;1989年05期
3 姚峰英,张敏;一种增强带噪语音可懂度的新算法[J];声学学报;2002年06期
4 胡书孝;提高教材可懂度技术的应用[J];医学教育;1992年06期
5 程容荃;;人造舌对全舌切除病人摄食和元音可懂度的影响[J];国外医学.耳鼻咽喉科学分册;1983年04期
6 齐鲁;从对话中摘出词句的可懂度[J];声学学报;1964年02期
7 齐鲁;从流利语言中摘出词句的可懂度——说话速度和词句长度的影响[J];声学学报;1964年02期
8 周笃强,黄端生,牛聪敏,陈善广,高慧;快速测量汉语语言可懂度方法的研究[J];航天医学与医学工程;1997年04期
9 吴小平;如何提高物理教材的可懂度[J];技术物理教学;2005年03期
10 蒋斌;匡正;吴鸣;杨军;;汉语音段反转言语的可懂度研究[J];声学学报;2012年06期
相关会议论文 前6条
1 许伟;曾新吾;龚昌超;;不同带宽和采样频率语音可懂度的实验研究[A];2008年全国声学学术会议论文集[C];2008年
2 汤朝菊;文森特·范赫恩;;汉语方言互懂度的实验测试[A];中国社会语言学(2006年第2期)[C];2006年
3 陈凯;俞蒙槐;胡上序;付强;;语音增强系统性能评测方法综述[A];第四届全国人机语音通讯学术会议(NCMMSC1996)论文集[C];1996年
4 尹建琪;覃春林;诸维明;;用于语声识别的自适应去噪[A];第二届全国人机语音通讯学术会议(NCMMSC1992)论文集[C];1992年
5 黄志华;;共振峰对维吾尔语语音可懂度的影响[A];2018年全国声学大会论文集 K语言声学与语音信号处理[C];2018年
6 王康;王鹏;邱小军;;汉语母语听者单耳英语通信可懂度受噪声的影响[A];2016年全国声学学术会议论文集[C];2016年
相关硕士学位论文 前10条
1 高源;基于音素的语音可懂度评价方法的研究与实现[D];北京工业大学;2018年
2 高飞;基于音频特性的语音可懂度评估[D];太原理工大学;2018年
3 刘鹏;高可懂度的信号子空间语音增强算法[D];太原理工大学;2014年
4 彭晓腾;语音可懂度客观评价策略的研究[D];内蒙古大学;2016年
5 郭利华;具有高可懂度的维纳滤波语音增强算法[D];太原理工大学;2014年
6 叶琪;低信噪比环境下语音可懂度增强算法研究[D];安徽大学;2016年
7 邝秀玉;多级低速率编解码级联语音可懂度增强算法研究与实现[D];电子科技大学;2011年
8 李娜;有效提高语音可懂度的语音增强方法研究[D];北京工业大学;2013年
9 徐宇卓;语音可懂度客观评价方法的研究[D];太原理工大学;2015年
10 罗钧;G.729与AMR级联语音可懂度提高技术研究[D];电子科技大学;2010年
本文编号:2787757
本文链接:https://www.wllwen.com/kejilunwen/wltx/2787757.html