基于条件随机场的口语理解研究
本文关键词:基于条件随机场的口语理解研究
【摘要】:随着互联网技术的飞速发展,用户对人机交互质量和人机对话系统的性能需求随之增加。在人机对话系统中需要利用到口语理解技术,该技术的发展水平对人机对话系统的性能起着至关重要的作用,因而需要寻找到合适的口语理解方式,以便促进人机对话系统的发展。口语理解过程涉及到自动语音识别技术,该技术在神经网络声学模型的发展带动下取得了很大进展。由于系统因素的影响,在自动语音识别时也可能出现一些识别错误问题,这些错误可能会因为不规则口语的存在而更明显。本文主要是对目前的口语理解问题进行了研究,通过对这些问题的分析提出了基于条件随机场模型的稳健性口语理解方法。本文的主要工作及创新点如下:1.语音识别性能的不理想造成的识别错误以及不符合文法的口语输入往往造成口语理解性能下降。针对此问题,本文提出一种改进口语理解稳健性的方法。该方法通过在训练数据集中人工加入错误文本噪声进行语料扩充,送入条件随机场口语理解模型进行训练,用得到的模型对具有噪声的未知数据集进行口语理解。2.针对口语理解语句中词与词向量之间的关系对口语理解的性能所产生的影响,提出了一种基于词嵌入的改进口语理解方法。首先用word2vec对口语理解语句进行词嵌入处理,得到语句中所有词的向量。通过计算词向量之间的相似度,从而得到每个词之间的相似度,再经过聚类,得到一个初始模糊分类。然后将这个初始模糊分类作为一个特征,与其他的特征一起送入条件随机场进行口语理解训练,得到最终的分类结果。最后对所建立的模型在汉语交通查询领域进行实证。实验结果表明,本文建立的这种方法显著优于先前的基于规则的方法,此外相比数据驱动算法而言,可以显著降低开发成本,性能却没有受到影响。
【关键词】:人机对话系统 条件随机场 口语理解 词嵌入
【学位授予单位】:新疆大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN912.34
【目录】:
- 摘要2-3
- Abstract3-7
- 第1章 绪论7-20
- 1.1 人机口语对话7-8
- 1.2 国内外人机对话研究现状8-9
- 1.3 口语理解9-18
- 1.3.1 口语理解方法10-18
- 1.4 论文的主要工作18-19
- 1.5 论文的组织结构19-20
- 第2章 条件随机场20-35
- 2.1 概率无向图模型20-23
- 2.1.1 模型定义20-22
- 2.1.2 概率无向图模型的因子分解22-23
- 2.2 条件随机场的定义与形式23-26
- 2.2.1 条件随机场的定义23-24
- 2.2.2 条件随机场的参数化形式24-25
- 2.2.3 条件随机场的简化形式25-26
- 2.3 条件随机场的概率计算问题26-28
- 2.3.1 前向-后向算法26-27
- 2.3.2 概率计算27
- 2.3.3 期望值的计算27-28
- 2.4 条件随机场的学习算法28-32
- 2.4.1 改进的迭代尺度法29-32
- 2.5 条件随机场的预测算法32-34
- 2.6 本章小结34-35
- 第3章 基于条件随机场的口语理解35-45
- 3.1 特征项选择35-36
- 3.2 实验准备36-41
- 3.2.1 实验所用的软件工具36-37
- 3.2.2 实验语料库37
- 3.2.3 文本预处理37
- 3.2.4 语料标注37-38
- 3.2.5 特征模板选择38-41
- 3.3 评估指标41
- 3.4 稳健性口语理解实验过程与结果分析41-44
- 3.4.1 无噪声条件下的口语理解41-42
- 3.4.2 噪声条件下的口语理解42-43
- 3.4.3 实验结果及分析43-44
- 3.5 本章小结44-45
- 第4章 基于词嵌入的改进口语理解45-52
- 4.1 基于词嵌入的改进口语理解系统框架45
- 4.2 词嵌入45-47
- 4.3 K -means聚类算法47
- 4.4 实验结果及分析47-50
- 4.5 与其他统计方法的比较50
- 4.6 本章小结50-52
- 第5章 总结与展望52-53
- 5.1 论文总结52
- 5.2 展望52-53
- 参考文献53-58
- 致谢58-59
- 攻读硕士期间已发表或录用的论文59-60
【相似文献】
中国期刊全文数据库 前10条
1 宗萍;施水才;王涛;吕学强;;基于条件随机场的英文地理行政实体识别[J];现代图书情报技术;2009年02期
2 张开旭;夏云庆;宇航;;基于条件随机场的古汉语自动断句与标点方法[J];清华大学学报(自然科学版);2009年10期
3 成姣;蔡东风;季铎;;基于条件随机场的日语依存分析[J];沈阳航空工业学院学报;2010年05期
4 李玲玲;金泰松;李翠华;;基于局部特征和隐条件随机场的场景分类方法[J];北京理工大学学报;2012年07期
5 宁伟;蔡东风;张桂平;季铎;苗雪雷;;基于条件随机场的冠词选择研究[J];中文信息学报;2008年06期
6 张玉芳;莫凌琳;熊忠阳;耿晓斐;;基于条件随机场的科研论文信息分层抽取[J];计算机应用研究;2009年10期
7 王昌厚;;基于条件随机场的中文命名体识别[J];福建电脑;2012年02期
8 施水才;王锴;韩艳铧;吕学强;;基于条件随机场的领域术语识别研究[J];计算机工程与应用;2013年10期
9 王东波;陈小荷;年洪东;;基于条件随机场的有标记联合结构自动识别[J];中文信息学报;2008年06期
10 方莹;;基于条件随机场的英文农产品名识别[J];河南科学;2011年03期
中国重要会议论文全文数据库 前5条
1 王东波;陈小荷;年洪东;;基于条件随机场的有标记联合结构自动识别[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
2 张奇;翁富良;黄萱菁;吴立德;;英文口语中非流利区域的检测[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
3 魏玮;杜金华;徐波;;基于分层语块分析的统计翻译研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
4 王根;赵军;;基于多重冗余标记CRF的句子情感分析研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
5 宁伟;蔡东风;季铎;;基于条件随机场的冠词选择研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
中国博士学位论文全文数据库 前1条
1 熊英;中文自然语言理解中基于条件随机场理论的词法分析研究[D];上海交通大学;2009年
中国硕士学位论文全文数据库 前10条
1 赵九洋;图像中行人检测关键技术研究[D];南京大学;2015年
2 宁振;基于层叠条件随机场的情感分析[D];南昌大学;2015年
3 杨献祥;面向中文微博的产品名实体识别与规范化算法设计与实现[D];北京理工大学;2015年
4 肖s,
本文编号:1102191
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1102191.html