当前位置:主页 > 科技论文 > 汽车论文 >

轨道交通下车载环境中的语音识别系统的研究

发布时间:2022-01-22 23:47
  轨道交通的安全在我国的经济发展、改善民生、国防安全上具有极大的意义。而列车员与调度中心的管制员之间的对话作业,是列车安全行驶指导过程中的核心部分。列车员由于工作强度大、对话环境嘈杂,容易误解听到的语音,从而导致操作失误,威胁列车的安全。语音自动识别技术可以检测列车员的操作行为,对由错误指令造成的危险进行提前预警,也可以对事故后的原因查明提供方便,是保障安全行驶的一个重要的手段。但是,因为列车对话作业语音在发音、语调等方面具有其特殊性,目前通用的语音自动识别技术不能直接使用。另一方面,列车员对话作业语音的数据具有难以采集和难以标注等特点,识别难度较大。为此,本文在语音自动识别技术面向轨道交通领域的应用以及提高识别准确率两方面开展了以下一些工作。(1)本文介绍了连续语音识别的框架与原理,包括了语音信号的发声机理、预处理、特征提取、语音信号的声音建模技术、发音字典和语言模型以及基于加权有限状态转化器的语音解码网络。(2)为了解决列车环境中的对话语音存在的噪声问题,本文以真实的列车员对话作业的语音信号数据为实验数据,对比了改进的谱减算法、维纳滤波算法、最小均方误差准则算法、人耳掩蔽模型降噪法四... 

【文章来源】:江苏科技大学江苏省

【文章页数】:77 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 课题的研究背景与目的
        1.1.1 选题的背景
        1.1.2 选题的目的与意义
    1.2 语音识别技术的研究和发展
        1.2.1 基于模板匹配的语音识别方法
        1.2.2 基于隐马尔可夫模型的语音识别方法
        1.2.3 基于神经网络模型的语音识别方法
    1.3 国内语音识别技术发展现况
    1.4 研究方法与内容
第2章 语音识别相关的理论
    2.1 语音信号的产生机理
        2.1.1 激励模型
        2.1.2 声道模型
        2.1.3 辐射模型
    2.2 语音识别系统的预处理
        2.2.1 语音信号的预处理
        2.2.2 语音信号的特征提取
    2.3 声音建模
        2.3.1 声音建模单元选择
        2.3.2 声音模型
    2.4 语言模型
    2.5 语音识别系统中的发音字典
    2.6 语音解码器网络构建
        2.6.1 语音识别解码过程
        2.6.2 端到端的语音识别解码器
    2.7 语音识别系统性能评价指标
    2.8 本章小结
第3章 列车对话语音信号降噪处理
    3.1 列车车载环境中的噪声特点
    3.2 语音信号降噪的方法
        3.2.1 改进的谱减算法
        3.2.2 维纳滤波算法
        3.2.3 最小均方误差准则算法
        3.2.4 人耳掩蔽模型降噪法
    3.3 实验结果和分析
        3.3.1 实验结果
    3.4 本章小结
第4章 基于GMM-HMM声音模型的语音识别系统搭建
    4.1 GMM-HMM基本原理
        4.1.1 HMM似然概率计算
        4.1.2 对HMM参数的估计
        4.1.3 HMM的解码问题
    4.2 列车语音识别语料的特征
    4.3 列车语音识别语料的准备
    4.4 特征的提取
    4.5 单音素模型的训练
    4.6 三音素模型的训练
    4.7 LDA+MLLT三音素模型的训练
    4.8 自适应训练
    4.9 实验
        4.9.1 实验平台的介绍
        4.9.2 实验参数
        4.9.3 实验结果与分析
    4.10 本章小结
第5章 基于LSTM-RNN声音模型的语音识别系统搭建
    5.1 RNN网络
    5.2 LSTM网络
        5.2.1 LSTM之遗忘门
        5.2.2 LSTM之输入门
        5.2.3 LSTM之细胞状态更新
        5.2.4 LSTM之输出门
    5.3 双向的循环神经网络
        5.3.1 深度双向LSTM神经网络
    5.4 LSTM网络的训练
    5.5 实验结果与分析
    5.6 本章小结
总结与展望
参考文献
攻读硕士学位期间承担的科研任务和主要成果
致谢


【参考文献】:
期刊论文
[1]“中国制造2025”和德国“工业4.0”对比研究[J]. 熊检.  中国集体经济. 2019(10)
[2]我国城市轨道交通发展的政策变迁[J]. 杨永平,赵东,边颜东.  都市快轨交通. 2019(01)
[3]我国城市地铁建设现状与发展战略分析[J]. 任杰.  企业科技与发展. 2019(01)
[4]几种开源英语识别工具包的对比分析[J]. 刘琼.  计算技术与自动化. 2018(04)
[5]受限波尔兹曼机[J]. 张春霞,姬楠楠,王冠伟.  工程数学学报. 2015(02)
[6]深度学习研究综述[J]. 孙志军,薛磊,许阳明,王正.  计算机应用研究. 2012(08)
[7]基于谱减法的听觉模拟的语音增强[J]. 陶智,赵鹤鸣,龚呈卉,吴迪.  计算机工程与应用. 2005(04)
[8]基于段长分布的HMM语音识别模型[J]. 王作英,肖熙.  电子学报. 2004(01)
[9]统计语言模型综述[J]. 邢永康,马少平.  计算机科学. 2003(09)
[10]语音倒谱特征的研究[J]. 王让定,柴佩琪.  计算机工程. 2003(13)

博士论文
[1]基于深度神经网络的语音识别模型研究[D]. 张仕良.中国科学技术大学 2017

硕士论文
[1]语音识别技术在人机交互中的应用研究[D]. 高雪.北方工业大学 2017
[2]基于一维卷积神经网络的车载语音识别技术研究[D]. 朱锡祥.安徽大学 2017
[3]噪声下的语音识别算法研究[D]. 刘辰晨.南京大学 2014
[4]基于文本无关的说话人识别研究[D]. 刘俊波.山东科技大学 2008
[5]语音识别系统关键技术研究[D]. 朱淑琴.西安电子科技大学 2004



本文编号:3603147

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/qiche/3603147.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户944bc***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com