当前位置:主页 > 科技论文 > 网络通信论文 >

基于DMLS的语音关键词检测技术研究

发布时间:2018-03-09 19:23

  本文选题:关键词检测 切入点:动态匹配词格检索 出处:《解放军信息工程大学》2014年硕士论文 论文类型:学位论文


【摘要】:语音关键词检测是指在语音数据中查找到所有可能出现的给定词的过程,是有效处理口语和实现人机智能通信的解决方案之一,具有广泛的应用前景。目前,基于动态匹配词格检索(Dynamic Match Lattice Spotting, DMLS)的方法是关键词检测的主流方法之一。DMLS将基于Lattice的快速检测和动态序列匹配技术融合在一起,在Lattice检索过程中应用最小编辑距离来补偿音素识别器的插入、删除和替换错误,实现了快速而准确的关键词检测。本文针对DMLS方法的特点,在Lattice生成、索引创建、关键词置信度和集外词检测等方面开展研究,主要工作及创新点如下:(1)音素Lattice的精度直接影响关键词检测的性能,为了提高Lattice的精度,应用TRAP特征和多层感知器构建了更为精准的音素Lattice生成系统,并在此基础上搭建了基于DMLS的关键词检测基线系统。该系统采用改进的维特比算法遍历Lattice来创建一个固定长度的音素序列数据库(Sequence Database, SDB),在检索阶段应用最小编辑距离作为置信度来实现关键词的检出。实验结果表明,基于TRAP特征生成的Lattic e搭建的基线系统相比MFCC和PLP特征具有一定的优势,系统的召回率提升了约5%。(2)针对DMLS中索引阶段SDB创建损失部分信息和查询项长度超出索引长度的问题,提出了一种改进的混合索引的方法,将最大概率音素序列和SDB融合构成混合索引。最大概率音素序列是语音识别中的1-best完整结果,可以代表整个Lattice上的全局最优结果,与SDB形成一定的互补,并且最大概率音素序列不受音素序列长度N的影响,可以用于辅助音素序列较长的查询项的检测。实验结果表明,混合索引方法相比单一的SDB索引系统的品质因数提升了1.4%。(3)在基于DMLS的关键词检测系统中,应用最小编辑距离作为关键词检出的置信度,该方法在提高检出率的同时也增加了虚警率。针对此问题,提出了一种融合后验概率的混合置信度方法。该方法首先将基于Lattice的后验概率引入到DMLS的索引建立中,其次应用数据驱动的音素替换、插入和删除代价来实现更加灵活的近似匹配,最后通过联合最小编辑距离和后验概率置信度得分进行关键词检测。实验结果表明,最小编辑距离和后验概率置信度具有一定的互补性,系统的等错误率相对降低了13.3%。(4)针对关键词检测中的集外词问题,提出了一种融合查询扩展和动态匹配的方法。由于查询扩展和动态匹配是在不同的层面补偿集外词发音的不确定性,考虑到两者潜在的互补性,研究了两种融合方法:一种方法是结果融合,分别应用查询扩展和动态匹配并行的检测集外词,然后合并检测结果;另一种是置信度融合,融合最小编辑距离和发音得分构成混合置信度进行集外词的检出与确认。实验结果表明,第二种融合方法的效果更好,系统的品质因数相对提升了19.8%。
[Abstract]:Speech keyword detection refers to the voice data to find all possible for a given word, is the effective treatment of oral and one solution to achieve intelligent man-machine communication, has wide application prospect. At present, the dynamic matching word lattice based retrieval (Dynamic Match Lattice Spotting, DMLS) method is one of the main methods of keyword detection.DMLS rapid detection and dynamic Lattice sequence matching technology together based on the application of insertion of the minimum edit distance in the Lattice retrieval process to compensate phoneme recognizer, delete and replace error, realize keyword detection quickly and accurately. This paper is based on DMLS method, create the index in the Lattice generation, and carry out study on the key words of confidence and out of vocabulary testing and other aspects, the main work and innovation are as follows: (1) directly affect the accuracy of the phoneme Lattice keyword detection ring The performance, in order to improve the accuracy of Lattice, application of TRAP and multilayer perceptron constructs a more precise phoneme Lattice generation system, which is established on the basis of DMLS baseline system based on keyword detection. The system adopts an improved Viterbi algorithm to traverse the Lattice to create a fixed length phoneme sequence database (Sequence Database. SDB), in the detection of phase retrieval using minimum edit distance as the confidence to achieve the keywords. The experimental results show that the baseline system characteristics of TRAP generated Lattic e based structures compared to MFCC and PLP feature has certain advantages, enhance the recall rate of about 5%. system (2) for the DMLS SDB to create the index loss part of the information and query length exceeds the length of the index, proposed a hybrid index improved, the maximum probability of phoneme sequences and SDB fusion hybrid The maximum probability index. 1-best is a complete sequence of phonemes results in speech recognition, can represent the global optimal results on the Lattice, form a complementary and SDB, and the maximum probability of phoneme sequence is not affected by the phoneme sequence length of N, can be used for the detection of query auxiliary phoneme sequences longer. The experimental results show that the mixed compared the quality factor index method SDB index system the improved 1.4%. (3) in the DMLS based keyword detection system, the application of minimum edit distance as the keyword detection confidence, this method can improve the detection rate and increase the false alarm rate. To solve this problem, we propose a hybrid fusion the confidence probability method. Firstly, Lattice posterior probability is introduced into the DMLS index based on data driven application to replace the second phone, insert and delete the price. The more flexible approximate matching, finally combined with the minimum edit distance and a posteriori probability confidence score for keyword detection. The experimental results show that the minimum edit distance and a posteriori confidence has a complementary system, etc. the relative error rate is reduced by 13.3%. (4) according to the problems in the detection of out of vocabulary words. This paper presents a fusion method for query expansion and dynamic matching. Because the query expansion and dynamic matching in pronunciation level compensation out of vocabulary of different uncertainty, considering the complementarity of the two potential, two kinds of fusion methods: one is the result of fusion was detected by out of vocabulary expansion and dynamic parallel matching the query, then merge the results; the other is confidence fusion, fusion minimum edit distance and the pronunciation score constitutes detection and validation of hybrid reliability of out of vocabulary words. The experimental results show that the effect of the second fusion methods is better, and the quality factor of the system is improved by 19.8%.

【学位授予单位】:解放军信息工程大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TN912.3

【相似文献】

相关期刊论文 前10条

1 阳小华;蒋辉;马家宇;;基于任务上下文的查询扩展方法[J];郑州大学学报(理学版);2010年01期

2 吴煈;张奇;黄萱菁;;基于整数线性规划的查询扩展[J];计算机研究与发展;2013年08期

3 何燕;;基于用户反馈的查询扩展研究[J];情报理论与实践;2013年08期

4 黄伟群;;基于用户视角的交互式查询扩展研究[J];图书情报工作;2014年05期

5 黄名选;严小卫;张师超;;查询扩展技术进展与展望[J];计算机应用与软件;2007年11期

6 林国俊;叶飞跃;耿冬;郑国良;;基于语义的概念查询扩展[J];计算机工程与设计;2009年06期

7 巩玉玺;王大玲;;一种改进的基于伪相关反馈的查询扩展[J];微计算机信息;2009年15期

8 黄名选;张师超;严小卫;;基于查询行为和关联规则的相关反馈查询扩展[J];计算机工程;2009年10期

9 张超盟;李战怀;温宗臣;;局部上下文分析剪枝概念树的查询扩展[J];计算机工程;2009年14期

10 罗小聪;;基于专用双语词典的查询扩展[J];现代计算机(专业版);2009年10期

相关会议论文 前10条

1 黄明初;钟威;何拥军;蒙斌;;基于查询扩展的数字档案检索策略[A];广西计算机学会2010年学术年会论文集[C];2010年

2 吕碧波;赵军;;基于相关文档池建模的查询扩展[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年

3 林建方;李生;郑德权;;基于词语搭配关系的查询扩展方法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

4 丁国栋;白硕;王斌;;一种基于局部共现的查询扩展方法[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年

5 李东园;白宇;蔡东风;;基于用户日志分析的查询扩展研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年

6 张志强;孟庆海;谢晓芹;;个性化的社会标签查询扩展技术研究[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年

7 王秉卿;张奇;吴立德;黄萱菁;;机器学习的查询扩展在博客检索中的应用[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年

8 王秉卿;黄萱菁;;基于线性模型的查询扩展方法[A];第五届全国信息检索学术会议论文集[C];2009年

9 晋松;林鸿飞;苏绥;;基于标签共现的查询扩展研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

10 郭文;史晓东;陈毅东;;跨语言信息检索中的查询扩展[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年

相关重要报纸文章 前1条

1 钟威 何拥军;数字档案信息扩展查询功能需求分析及实现方式[N];中国档案报;2011年

相关博士学位论文 前3条

1 郭晓黎;煤矿安全事件本体及其在查询扩展中的应用研究[D];中国矿业大学(北京);2016年

2 仲兆满;事件本体及其在查询扩展中的应用[D];上海大学;2011年

3 王俊义;正负相关反馈与查询扩展技术的研究[D];内蒙古大学;2012年

相关硕士学位论文 前10条

1 郑永军;基于DMLS的语音关键词检测技术研究[D];解放军信息工程大学;2014年

2 姚小同;查询扩展技术研究[D];北京邮电大学;2009年

3 许威;基于概念格的查询扩展系统及建格算法研究[D];北京邮电大学;2008年

4 胡保祥;基于查询日志的查询扩展研究[D];北京邮电大学;2013年

5 董静;基于信任网络的查询扩展技术研究[D];哈尔滨工程大学;2013年

6 郭青;基于用户标注信息的查询扩展方法研究[D];大连理工大学;2014年

7 尹俊杰;基于本体术语关系的局部查询扩展[D];河北大学;2012年

8 瞿国忠;查询扩展技术研究[D];华中师范大学;2007年

9 林智超;基于查询扩展的网络信息语义检索服务的研究与实现[D];华东师范大学;2012年

10 陈U,

本文编号:1589914


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/1589914.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4f169***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com