维吾尔语大词汇语音识别系统识别单元研究
本文选题:维吾尔语 + 大词汇 ; 参考:《北京大学学报(自然科学版)》2014年01期
【摘要】:维吾尔语是一种黏着语,单词不太适合作为维吾尔语大词汇连续语音识别系统识别单元。针对维吾尔语大词汇连续语音识别系统中的识别单元选择问题,设计更适合维吾尔语的子词识别单元,提出维吾尔语单词和子词相结合的组合识别单元构建方法,并对单词、子词和组合识别单元的语言模型和语音识别性能进行评价。实验结果表明,所提出的识别单元在单元数量、语言模型复杂度等方面表现出更加优越的性能,并且使识别系统的单词错误率比基于单词的系统相对减少22%。
[Abstract]:Uygur is a kind of adherent language, and words are not suitable for the recognition unit of Uygur large vocabulary continuous speech recognition system. In order to solve the problem of unit selection in Uygur large vocabulary continuous speech recognition system, a sub-word recognition unit which is more suitable for Uygur language is designed, and a method of combining Uygur words with sub-words is proposed. The language model and speech recognition performance of sub-words and combined recognition units are evaluated. The experimental results show that the proposed recognition unit has better performance in terms of the number of units and the complexity of the language model, and the word-error rate of the recognition system is reduced by 22% compared with that of the word-based system.
【作者单位】: 新疆大学信息科学与工程学院;
【基金】:国家自然科学基金(61063024,61363063) 新疆维吾尔自治区多语种信息处理重点实验室开放课题(049807)资助
【分类号】:TN912.34
【参考文献】
相关期刊论文 前4条
1 薛化建;董兴华;周喜;吐尔洪·吾司曼;李晓;;基于子字单元的维吾尔语语音识别研究[J];计算机工程;2011年20期
2 古丽拉·阿东别克,米吉提·阿布力米提;维吾尔语词切分方法初探[J];中文信息学报;2004年06期
3 早克热·卡德尔;艾山·吾买尔;吐尔根·依布拉音;帕里旦·吐尔逊;吴小川;;混合策略的维吾尔语名词词干提取系统[J];计算机工程与应用;2013年01期
4 张小燕;宿建军;薛化建;王磊;;维吾尔语语音识别语料库中的OOV研究[J];计算机工程与设计;2012年02期
【共引文献】
相关期刊论文 前10条
1 王苏敏;廖晶晶;赵秀鸟;;基于DTW和HMM算法的语音识别系统对比研究[J];计算机光盘软件与应用;2012年11期
2 陈鸽;王廷梅;赵玮;;一种新的维汉英混排文本显示模型的设计[J];硅谷;2012年16期
3 陈强;何炎祥;刘续乐;孙松涛;彭敏;李飞;;基于句法分析的跨语言情感分析[J];北京大学学报(自然科学版);2014年01期
4 古丽拉·阿东别克,艾尔肯·伊米尔;维吾尔文校对中常见错误分析[J];计算机工程与应用;2005年27期
5 赵永进;郭大庆;卢有飞;李英凡;;维文软件中排版关键技术的研究与实现[J];计算机工程与应用;2007年22期
6 苏建辉;程晶;蒋同海;;维、哈、柯文版Linux操作系统关键技术的设计实现[J];计算机科学;2008年10期
7 吐尔地·托合提;维尼拉·木沙江;艾斯卡尔·艾木都拉;;维、哈、柯全文搜索引擎检索器的关键技术[J];计算机工程;2008年21期
8 薛化建;董兴华;周喜;吐尔洪·吾司曼;李晓;;基于子字单元的维吾尔语语音识别研究[J];计算机工程;2011年20期
9 张伟;任大明;许晓辉;赵凡;张岩;;维、哈、柯文显示及排版技术研究[J];计算机应用研究;2008年03期
10 吐尔地·托合提;维尼拉·木沙江;艾斯卡尔·艾木都拉;;维、哈、柯多文种全文搜索引擎的设计与实现[J];计算机应用与软件;2009年06期
相关会议论文 前9条
1 维尼拉·木沙江;吴俊森;吐尔根·依布拉音;;维吾尔文搜索引擎的倒排索引设计与实现[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
2 吐尔地·托合提;维尼拉·木沙江;米吉提·阿不里米提;;维吾尔文搜索引擎Web Server的实现[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
3 米吉提·阿不里米提;艾斯卡尔·艾木都拉;吐尔地·托合提;;维语词法分析器研究开发[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
4 吐尔地·托合提;维尼拉·木沙江;艾斯卡尔·艾木都拉;;维、哈、柯全文搜索引擎中查询处理研究与实现[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
5 李文;李淼;张建;陈雷;雪艳;;一种带权值参数的非监督式形态切分方法[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
6 海丽且木·艾沙;维尼拉·木沙江;;Web文本分类及其维、哈、柯多文种信息检索中的应用研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
7 王珍;维尼拉·木沙江;赵丽红;;维、哈、柯文搜索引擎中自动分类技术的应用研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
8 通拉嘎;;汉、蒙、藏、维分词与词性标注技术发展现状研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
9 努尔麦麦·提尤鲁瓦斯;吾守尔·斯拉木;热依曼·吐尔逊;;基于音节的维吾尔语大词汇连续语音识别系统[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年
相关博士学位论文 前2条
1 陈洁;基于概念融合的网页筛选技术研究[D];北京邮电大学;2013年
2 刘楠;面向微博短文本的情感分析研究[D];武汉大学;2013年
相关硕士学位论文 前10条
1 热依玛依·买买提;维、哈、柯搜索引擎中基于文本的图像检索技术的研究[D];新疆大学;2011年
2 赵倩倩;维吾尔语信息检索[D];天津大学;2012年
3 陈丽珍;维文网络中不良文本信息检索、监控系统的研究[D];新疆大学;2006年
4 陈鹏;基于语料库的维吾尔语词干提取和词性标注[D];新疆大学;2006年
5 马欢;基于不定长拼接单元的维吾尔语文语转换系统的研究与实现[D];新疆大学;2006年
6 张冉;主题搜索引擎的研究与设计[D];新疆大学;2006年
7 蔡琴;基于HTK的维吾尔语连续数字语音识别研究[D];新疆大学;2007年
8 胡颜琪;维、汉多语种农村信息化系统研究与实现[D];新疆大学;2008年
9 王珍;维、哈、柯文搜索引擎中的自动分类技术研究[D];新疆大学;2010年
10 刘俊;基于windows7的维文多语种操作系统本地化的研究与实现[D];新疆大学;2012年
【二级参考文献】
相关期刊论文 前10条
1 王志明;陶建华;;文本-视觉语音合成综述[J];计算机研究与发展;2006年01期
2 李艳红;郑家恒;;大规模语料库可用性评测方法[J];计算机工程与应用;2009年16期
3 姑丽加玛丽·麦麦提艾力;艾斯卡尔·肉孜;艾斯卡尔·艾木都拉;;三音素模型的维吾尔语最佳文本选取算法[J];计算机工程与应用;2009年18期
4 李永宏;于洪志;孔江平;;藏语连续语音语料库设计与实现[J];计算机工程与应用;2010年13期
5 李晨冲;董滨;潘复平;曾兴雯;颜永红;;汉语普通话易混淆音素的识别[J];计算机工程;2009年23期
6 殷建平;汉语自动分词方法[J];计算机工程与科学;1998年03期
7 章森;刘磊;刁麓弘;;大规模语音语料库及其在TTS中应用的几个问题[J];计算机学报;2010年04期
8 那斯尔江·吐尔逊;吾守尔·斯拉木;;基于隐马尔可夫模型的维吾尔语连续语音识别系统[J];计算机应用;2009年07期
9 古丽拉·阿东别克,米吉提·阿布力米提;维吾尔语词切分方法初探[J];中文信息学报;2004年06期
10 阿依克孜·卡德尔;开沙尔·卡德尔;吐尔根·依布拉音;;面向自然语言信息处理的维吾尔语名词形态分析研究[J];中文信息学报;2006年03期
相关会议论文 前2条
1 张皖志;陶建华;;基于声韵母基元的嵌入式中文语音合成系统[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
2 艾山·吾买尔;吐尔根·依不拉音;早克热·卡德尔;;维吾尔语名词词干提取算法的研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
【相似文献】
相关期刊论文 前10条
1 那斯尔江·吐尔逊;吾守尔·斯拉木;;基于隐马尔可夫模型的维吾尔语连续语音识别系统[J];计算机应用;2009年07期
2 蔡琴;吾守尔·斯拉木;;基于HTK的维吾尔语连续数字语音识别[J];现代计算机;2007年04期
3 王飞飞;吾守尔·斯拉木;那斯尔江·吐尔逊;;基于DDBHMM的维吾尔语音声学识别[J];计算机工程;2011年02期
4 蔡瑞昌;;未来的电话[J];电子技术;1980年08期
5 赵鹤芹;;一个适用于孤立单词语音识别系统的数据压缩方法—WHT算法[J];云南工业大学学报;1990年03期
6 马天蔚;;让语音超越桌面[J];每周电脑报;1999年32期
7 ;文字/语音识别系统[J];中国电子商情;2001年01期
8 刘云冰;;语音识别技术的回顾与展望[J];软件导刊;2005年13期
9 刘福才;王冬云;;语音识别技术及其在控制领域中的应用研究(一)[J];可编程控制器与工厂自动化;2005年11期
10 王宏;郭艳丽;贾新民;;基于HMM的孤立字识别[J];昌吉学院学报;2006年01期
相关会议论文 前10条
1 王昆仑;樊志锦;吐尔洪江;方晓华;徐绍琼;吾买尔;;维吾尔语综合语音数据库系统[A];第五届全国人机语音通讯学术会议论文集[C];1998年
2 杨学增;方棣棠;;神经网络用于语音识别初探[A];第一届全国语言识别学术报告与展示会论文集[C];1990年
3 王作英;;非齐次语音识别HMM模型和THED语音识别与理解系统[A];第二届全国人机语音通讯学术会议论文集[C];1992年
4 王承发;赵德彬;金山;苗百利;朱志莹;;语音识别应用中抗噪声干扰方法的初步探讨[A];第二届全国人机语音通讯学术会议论文集[C];1992年
5 胡春静;吴善培;;不定人的语音识别系统[A];第三届全国人机语音通讯学术会议论文集[C];1994年
6 董林;袁保宗;周继成;;一种基于神经网络的汉语语音识别方法[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
7 国立新;莫福源;李昌立;;基于分段K平均训练的汉语全音节语音识别的研究[A];第三届全国人机语音通讯学术会议论文集[C];1994年
8 崔毓菁;刘刚;;基于HMM的语音识别系统中状态输出概率计算优化算法的研究[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
9 王承发;肖毅壮;韩纪庆;;一种语音识别系统的端点检测算法[A];第二届全国人机语音通讯学术会议论文集[C];1992年
10 何为民;赵锐;陈光发;;军事口令非特定人识别系统的实现[A];第三届全国人机语音通讯学术会议论文集[C];1994年
相关重要报纸文章 前10条
1 通讯员 吉春;汉族民警用维吾尔语介绍法律知识[N];巴音郭楞日报;2008年
2 本报记者 朱彤;俺们的“穷多克特”[N];科技日报;2009年
3 高方;让电影璀璨乡村的夜晚[N];新疆日报(汉);2008年
4 阎晓明;掌声传递团结的心声[N];人民日报;2009年
5 李 昕;乌鲁木齐市举办维吾尔语系科普知识竞赛[N];大众科技报;2003年
6 记者 李U,
本文编号:2057558
本文链接:https://www.wllwen.com/kejilunwen/wltx/2057558.html