藏语语音识别技术研究
本文关键词:藏语语音识别技术研究
更多相关文章: 藏语 语音识别 隐马尔可夫模型 语言模型 HTK
【摘要】:语音识别是一种计算机通过识别和理解过程把人类的语音信号变成相应的文本或命令的技术,这项技术的研究开始于50年代。自从1952年贝尔在实验室成功研制了世界上第一个能识别十个英文数字发音的实验系统,语音识别这项技术被越来越多的国家机构和公司所关注并投入巨资进行研究和开发。如今语音识别技术已经成为当今信息处理研究的一个热点。英语、汉语等语言的语音识别研究已经取得了很大的成就,但是藏语等中国少数民族语言的语音识别研究还处在初步阶段。本文中阐述了研究藏语语音识别技术的意义和研究结果的应用价值,以及语音识别技术的总体概述,介绍了藏文的音节结构和藏语语音的特点,分析了现代藏语语音的特征和藏语语音识别基元的选择,详细介绍了藏语语音识别语料库的建立,基于声韵母结构的藏语发音字典的建立,藏语语音识别统计语言模型的创建和基于隐马尔科夫理论的声学模型的训练。在汉语和英语的语音识别技术研究成果的基础之上,再结合藏语语言学的知识和卫藏方言的语音特点分析,初步实现了藏语卫藏方言的语音识别技术,在此基础上,开发了基于HTK工具包的非特定人小词汇量的藏语连续语音识别系统和基于语音识别芯片LD3320模拟人机对话的藏语语音识别系统。
【关键词】:藏语 语音识别 隐马尔可夫模型 语言模型 HTK
【学位授予单位】:西藏大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:H214
【目录】:
- 摘要6-7
- ABSTRAC7-9
- 第一章 绪论9-13
- 1.1 本论文的研究目的和意义9-10
- 1.2 论文的难点10-11
- 1.3 论文研究内容和组织结构11-12
- 1.4 创新点12-13
- 第二章 语音识别技术概述13-21
- 2.1 语音识别的分类13-14
- 2.2 语音识别方法14-16
- 2.2.1 基于语言学和声学的方法14-15
- 2.2.2 模板匹配的方法15
- 2.2.3 人工神经网络的方法15-16
- 2.3 语音识别发展历史及现状16-21
- 2.3.1 藏语语音识别技术的研究现状17-21
- 第三章 藏语语音识别系统研究21-48
- 3.1 藏语语音基本特点21-27
- 3.1.1 藏语语音生理属性21-24
- 3.1.2 藏文的音节结构24-26
- 3.1.3 藏语方言26-27
- 3.2 藏语语音识别系统结构27
- 3.3 语音信号处理与分析27-31
- 3.3.1 语音信号的数字化处理28
- 3.3.2 语音信号的预处理28-29
- 3.3.3 语音信号的特征提取29-31
- 3.3.3.1 线性预测倒谱系数30
- 3.3.3.2 美尔倒谱系数30-31
- 3.4 藏语语音识别基元的选择31-33
- 3.4.1 语音识别基元选取原则31
- 3.4.2 藏语语音识别基元的选取31-33
- 3.5 藏语语音识别语音语料库的收集与标注33-37
- 3.5.1 文本语料的收集和整理34
- 3.5.2 语音数据的采集及整理34
- 3.5.3 语音库标注34-37
- 3.5.3.1 语料标注34-37
- 3.5.3.2 语音标注37
- 3.6 藏语发音字典的建立37-39
- 3.7 语言模型39-41
- 3.7.1 语言模型的分类39-41
- 3.7.1.1 文法语言模型40
- 3.7.1.2 统计语言模型40-41
- 3.8 声学模型41-48
- 3.8.1 隐马尔科夫模型42-44
- 3.8.2 隐马尔科夫模型的三个问题及其基本解决方案44-48
- 3.8.2.1 问题1的求解——前向后向算法44-46
- 3.8.2.2 问题2的求解——Vterbi算法46
- 3.8.2.3 问题3的求解——Baum-Welch算法46-48
- 第四章 藏语语音识别系统实现48-78
- 4.1 利用HTK工具包实现藏语小词汇量连续语音识别系统(实验 1)48-70
- 4.1.1 HTK工具包介绍48-51
- 4.1.1.1 HTK工具包结构48-49
- 4.1.1.2 HTK工具包训练模型流程49-51
- 4.1.2 藏语小词汇量连续语音识别技术的具体实现51-69
- 4.1.2.1 准备数据53-57
- 4.1.2.2 模型训练57-62
- 4.1.2.3 创建绑定状态的三音素模型62-66
- 4.1.2.4 任务语法文件66-67
- 4.1.2.5 识别器评估67-69
- 4.1.3 实验结果分析69-70
- 4.1.3.1 识别基元对识别率的影响69-70
- 4.1.3.2 语言模型对识别率的影响70
- 4.2 基于LD3320 芯片实现的藏语语音识别系统 (实验 2)70-78
- 4.2.1 LD3320 简介70-72
- 4.2.2 利用LD3320 语音识别专用芯片实现的藏语语音识别72-75
- 4.2.3 基于HTK工具包和基于LD3320 语音识别芯片的识别率比较75-78
- 4.2.3.1 基于HTK的藏语孤立词识别75-76
- 4.2.3.2 基于LD3320 语音识别芯片的藏语孤立词识别76-78
- 第五章 总结与展望78-80
- 5.1 总结78-79
- 5.2 展望79-80
- 参考文献80-82
- 附录82-87
- 攻读学位期间发表的学术论文目录87
- 攻读学位期间参加过的科研项目87-88
- 致谢88
【相似文献】
中国期刊全文数据库 前4条
1 金承信;语音识别技术的应用及发展[J];外语电化教学;1991年01期
2 孔菊芳;;基于语音识别技术的英语学习网站分析[J];哈尔滨职业技术学院学报;2012年05期
3 华山;;郭家兄弟:“地图日记”掌门人[J];黄金时代;2008年09期
4 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 蔡伟建;;人工神经网络理论在语音识别技术中的应用[A];第八届全国信息获取与处理学术会议论文集[C];2010年
2 张化云;韩兆兵;徐波;;语音服务器中的语音识别技术[A];开创新世纪的通信技术——第七届全国青年通信学术会议论文集[C];2001年
3 方棣棠;李树青;;语音识别技术突破之路——如何使语音识别技术走向实用[A];第八届全国人机语音通讯学术会议论文集[C];2005年
4 贾磊;;深度神经网络建模的最新工业进展和结合语义理解的语音识别技术[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年
5 赵美泽;王峰;;基于消除混响的语音识别技术研究[A];2008通信理论与技术新发展——第十三届全国青年通信学术会议论文集(下)[C];2008年
6 蔡志博;俞铁城;;语音识别技术的应用[A];西部大开发 科教先行与可持续发展——中国科协2000年学术年会文集[C];2000年
7 吕成国;赵冰;;低信噪比下语音识别技术的研究[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年
8 魏峰;徐成;曾祺;;基于HMM的语音识别技术研究[A];2006通信理论与技术新进展——第十一届全国青年通信学术会议论文集[C];2006年
9 黄媛;俞舸;吕士楠;;车载识别库的设计和制作[A];中国声学学会2006年全国声学学术会议论文集[C];2006年
10 张茹;韩纪庆;;基于DTW算法的自动发音错误检测[A];第八届全国人机语音通讯学术会议论文集[C];2005年
中国重要报纸全文数据库 前10条
1 陈琳;语音识别技术升级,人机对话时代来临[N];第一财经日报;2007年
2 京晨;中科院最新语音识别技术面世[N];福建科技报;2002年
3 IBM中国研究中心 沈丽琴博士;语音识别技术离我们有多远[N];光明日报;2000年
4 ;语音识别技术前景诱人[N];人民邮电;2001年
5 ;用语言“改变”世界[N];计算机世界;2001年
6 英国《经济学人》;有错请纠正:语音识别技术新进展[N];世界报;2010年
7 ;精彩演绎语音识别技术[N];人民邮电;2001年
8 记者 王双;我市参加第九届“高交会”收获成果[N];盘锦日报;2007年
9 记者 薛冬;中文语音识别技术取得突破[N];光明日报;2002年
10 王朝选;科大讯飞语音识别技术取得重大进展[N];中国高新技术产业导报;2008年
中国博士学位论文全文数据库 前3条
1 王欢良;基于混淆网络和辅助信息的语音识别技术研究[D];哈尔滨工业大学;2007年
2 张军;抗噪声语音识别技术的研究[D];华南理工大学;2003年
3 董婧;鲁棒语音识别技术的研究[D];吉林大学;2007年
中国硕士学位论文全文数据库 前10条
1 张朝阳;语音识别技术在盲用导航系统中的应用[D];北方工业大学;2011年
2 罗云;语音识别技术在超声波系统中的应用[D];四川大学;2005年
3 洪祥元;基于语音识别技术的智能地球仪系统设计[D];北京交通大学;2012年
4 陈一宁;英语口语学习中的语音识别技术[D];上海交通大学;2010年
5 李晨;结合语音识别技术的音乐哼唱检索研究[D];西北大学;2008年
6 燕涛;基于嵌入式语音识别技术的研究[D];大庆石油学院;2009年
7 涂惠燕;移动设备平台上英语口语学习中的语音识别技术[D];上海交通大学;2011年
8 朱莉明;基于可穿戴计算平台的语音识别技术的研究[D];西北大学;2007年
9 王秀景;语音识别技术研究与实现[D];山东科技大学;2011年
10 付大丽;语音识别技术在医用配伍表中的应用研究[D];西安工程大学;2013年
,本文编号:943854
本文链接:https://www.wllwen.com/wenyilunwen/yuyanxuelw/943854.html