面向领域的语音转换后文本纠错研究
【学位单位】:华南理工大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:TP391.1;TN912.3
【部分图文】:
图 2-3 LSTM 单元结构,一个 LSTM 单元的输入是at,输出值是ht,LSTM 内部的it= σ(Waiat+ Whiht 1+ Wcict 1+ bi) ft= σ(Wafat+ Whfht 1+ Wcfct 1+ bf) ot= σ(Waoat+ Whoht 1+ Wcoct+ bo) ct= ftct 1+ ittanh(Wacat+ Whcht 1+ bc) ht= ottanh(ct) gmoid 激活函数,it,ft,ot,ct分别代表输入门,遗忘门i,bf,bo,bc分别代表输入门,遗忘门,输出门,cell 单权值参数。的过程中,输入门使新的信息选择性地通过,进入到 Cel储的信息选择性地输出。遗忘门则是控制 Cell 单元内部的
构建银行金融产品的本体知识库究的客服文本中,比较常见的错误是语音引擎对银行的金融产品行的金融产品建立知识库是必要的,其将用于计算纠错候选集第五章将会介绍。本文采取基于本体的知识库构建方法。本体(,知识工程借用了这个概念,用于计算机知识系统领域知识的获术语的集合,其结构是层次化的,可作为知识库的骨架和基础构建本体。本体需要包括概念,关系,函数,公理和实例这五种银行官方网站介绍金融产品的页面,发现网站上已经对金融产品述的方式已经是结构化的信息。因此,本体的概念构建可以复用相关属性,对应的实例则是具体的金融产品,其信息可以通过爬进行获取。其官方网站的部分截图如:
图 4-1 查错流程图gram 模型组合查错方法介绍了 N-gram 模型的相关理论。N-gram 是一个基,如果仅采用通用语料的的 N-gram 模型,一些领或出现频次较低,导致在领域文本中一些本是正确是错误点。因此,要减少查错的误报,需要用到多文本,本文用到 3 个模型:公开的新闻语料训练的 N-gram 模型。行官网的业务说明、产品介绍等文本的训练的 N服文本中整理过的 200 个对话文本训练的 N-gram
【参考文献】
相关期刊论文 前10条
1 王璐;张仰森;;基于典型句型的词语搭配定量分析及提取算法[J];计算机科学;2012年S1期
2 王惠仙;龙华;;基于改进的正向最大匹配中文分词算法研究[J];贵州大学学报(自然科学版);2011年05期
3 玛依热·依布拉音;米吉提·阿不里米提;艾斯卡尔·艾木都拉;;基于最小编辑距离的维语词语检错与纠错研究[J];中文信息学报;2008年03期
4 顾金睿;王芳;;关于本体论的研究综述[J];情报科学;2007年06期
5 韦向峰;张全;熊亮;;一种基于语义分析的汉语语音识别纠错方法[J];计算机科学;2006年10期
6 张仰森;曹元大;俞士汶;;基于规则与统计相结合的中文文本自动查错模型与算法[J];中文信息学报;2006年04期
7 张仰森;俞士汶;;文本自动校对技术研究综述[J];计算机应用研究;2006年06期
8 张仰森;中文校对系统中纠错知识库的构造及纠错建议的产生算法[J];中文信息学报;2001年05期
9 李建华,王晓龙,王平,王淑清;多特征的中文文本校对算法的研究[J];计算机工程与科学;2001年03期
10 吴岩,李秀坤,刘挺,王开铸;中文自动校对系统的研究与实现[J];哈尔滨工业大学学报;2001年01期
相关硕士学位论文 前8条
1 卓利艳;字词级中文文本自动校对的方法研究[D];郑州大学;2018年
2 石宏磊;通信业客服热线文本主题识别与演化研究[D];北京邮电大学;2017年
3 石敏;中文文本自动校对系统[D];江苏科技大学;2015年
4 季俊;客户投诉电话语音的情感分析技术研究[D];复旦大学;2014年
5 龙丽霞;基于实例语境的语音识别后文本检错与纠错研究[D];北京邮电大学;2010年
6 王兴建;语音识别后文本处理系统中文本语音信息评价算法研究[D];北京邮电大学;2010年
7 王永景;面向文本识别流的自动校对算法研究[D];上海交通大学;2008年
8 王朔;基于Chart算法的句法分析系统的设计与实现[D];湖南大学;2005年
本文编号:2824753
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/2824753.html