当前位置:主页 > 科技论文 > 信息工程论文 >

基于层次化结构的语言模型单元集优化

发布时间:2018-04-19 06:35

  本文选题:语音识别 + 语言模型 ; 参考:《清华大学学报(自然科学版)》2017年03期


【摘要】:对于大词汇量语音识别系统,适当选择基本单元至关重要。虽然以词为基本单元时避免了词边界的确定等复杂过程,但很多派生类结构中(如黏性语言),词比较长,而且很多文字(如中文、日文等)不需要词边界,因而在自然语言处理应用中没有选取基本单元集的固定模式。该文以维吾尔语大词汇量语音识别系统为例,研究基于各个层次化粒度单元的语音识别系统。通过比较各种层次化单元集为基础的语音识别结果,分析错误识别模式,收集被误判的单元序列作为在2层单元序列结构中择优的训练样本库。比较各种单元集的优缺点,提出一种能平衡长单元集和短单元集优点的方法。实验结果表明:该方法不仅可以有效提高语音识别准确率,也大大缩减了词典容量。
[Abstract]:For large vocabulary speech recognition system, it is very important to select appropriate basic units.Although the word is used as the basic unit to avoid complex processes such as word boundary determination, many derived structures (such as viscous language) have longer words, and many words (such as Chinese, Japanese, etc.) do not need word boundaries.Therefore, the fixed pattern of basic unit set is not selected in natural language processing applications.Taking Uygur large vocabulary speech recognition system as an example, this paper studies a speech recognition system based on hierarchical granularity units.By comparing the results of speech recognition based on various hierarchical unit sets, the error recognition patterns are analyzed, and the misjudged unit sequences are collected as a training sample base to select the best in the two-layer unit sequence structure.By comparing the advantages and disadvantages of various cell sets, a method is proposed to balance the advantages of long and short cell sets.The experimental results show that this method can not only improve the accuracy of speech recognition, but also greatly reduce the dictionary capacity.
【作者单位】: 新疆大学科学与技术学院;新疆大学信息科学与工程学院;
【基金】:国家自然科学基金资助项目(61462085,61662078,61163032) 教育部新世纪优秀人才支持计划资助项目(NCET-10-0969) 新疆维吾尔自治区高新技术发展研究计划项目(201312103)
【分类号】:TN912.34

【相似文献】

相关重要报纸文章 前3条

1 本报记者 王扬 通讯员 曾庆刚 张文祥;高亚平细分单元要素 力促管理精益[N];中国煤炭报;2010年

2 曹元文 徐忠波 娄纯泗;单元集成训练探要[N];解放军报;2004年

3 ;六单元集成IGBT模块[N];计算机世界;2001年

相关博士学位论文 前1条

1 李坦;Mindlin板高阶杂交应力单元及其增强型分片检验[D];大连理工大学;2015年

相关硕士学位论文 前4条

1 童迪;考虑新任务插入的虚拟单元动态构建与调度问题研究[D];江苏科技大学;2015年

2 陆周周;基于枚举删除的ESO算法研究[D];重庆大学;2015年

3 朱涵;车联网路侧单元部署算法研究[D];大连理工大学;2016年

4 杨瑞岩;包装单元、搬运单元和集装单元匹配关系建模与优化[D];吉林大学;2013年



本文编号:1771979

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1771979.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9eb6d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com