THUYG-20:免费的维吾尔语语音数据库
本文选题:语音识别 + 维吾尔语 ; 参考:《清华大学学报(自然科学版)》2017年02期
【摘要】:语音数据资源是语音识别研究的基础。当前国内只有为数不多的开放的语音数据库供研究者免费使用,特别是在维吾尔语等少数民族语音识别方面,数据资源更为贫乏。该文发布一个完全免费的维吾尔语连续语音数据库,该数据库包括约20h的训练数据和1h的测试数据,同时介绍了构建维吾尔语语音识别系统所需要的音素集、词表、文本数据等相关资源,以及用于构建基线系统的脚本。给出了该基线系统在纯净测试数据和噪声测试数据上的识别性能。该数据库为维吾尔语语音识别研究提供了可以借鉴的标准数据库。
[Abstract]:Speech data resource is the foundation of speech recognition. At present, there are only a few open speech databases for the free use of researchers, especially in the Uygur language and other minority speech recognition, the data resources are even poorer. This paper presents a free Uygur continuous speech database, which includes about 20 hours of training data and 1 hour of test data. At the same time, it introduces the phoneme set and thesaurus needed to construct the Uygur speech recognition system. Related resources, such as text data, and scripts for building a baseline system. The recognition performance of the baseline system on pure test data and noise test data is given. This database provides a standard database for Uygur speech recognition research.
【作者单位】: 清华大学计算机科学与技术系清华信息科学技术国家实验室信息技术研究院;新疆大学信息科学与工程学院;
【基金】:国家自然科学基金项目(61271389,61371136) 国家“九七三”重点基础研究发展计划(2013CB329302)
【分类号】:TN912.34;TP311.13
【相似文献】
相关期刊论文 前10条
1 ;中央电台新疆维吾尔语编辑部开工建设[J];中国广播;2010年06期
2 盛朝川;;维吾尔语专线广播[J];新闻记者;1984年03期
3 艾山·吾买尔;吐尔根·依步拉音;;基于最大熵的维吾尔语句子边界识别模型[J];计算机工程;2010年06期
4 王昆仑;张贯虹;吐尔洪江·阿布都克力木;;维吾尔语元音的声频特性分析和识别[J];中文信息学报;2010年02期
5 地里木拉提.吐尔逊;艾斯卡尔.艾木都拉;;维吾尔语中清化元音的实验语音学研究[J];中文信息学报;2010年05期
6 丁玉忠;吾守尔·斯拉木;那斯尔江·吐尔逊;;基于垃圾模型的维吾尔语关键词识别[J];现代计算机(专业版);2011年13期
7 塔世根·加帕尔,帕尔哈提·艾孜木,伊力亚斯·吐尔逊;维吾尔语地理学术语规范表达的必要性和紧迫性[J];术语标准化与信息技术;1998年04期
8 阿丽叶.阿布列孜;;中央人民广播电台维吾尔语频道《生活》栏目探析[J];新闻世界;2014年05期
9 哈妮克孜·伊拉洪;祖丽皮亚·阿曼;艾斯卡尔·艾木都拉;;维吾尔语单音节词复辅音声学分析[J];中文信息学报;2009年04期
10 刘改霞;;从《维吾尔语会话300句速成》谈选题策划的特性[J];新疆新闻出版;2010年05期
相关会议论文 前10条
1 吾买尔江·库尔班;阿里甫·库尔班;;维吾尔语框架语义知识库语义角色描述体系研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
2 阿里甫·库尔班;吾买尔江·库尔班;尼加提·阿不都肉苏力;;维吾尔语框架语义网的数据库结构的设计[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
3 古丽娜尔·艾力;买买提玉素甫·苏来曼;;维吾尔语语音数据自动标注[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
4 阿布都热依木·热合曼;艾山·吾买尔;吐尔根·依布拉音;帕里旦·吐尔逊;哈里旦木·阿布都克里木;;维吾尔语句法树库标注体系[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
5 艾斯卡尔·艾木都拉;;维吾尔语鼻音的声学特征分析[A];第九届中国语音学学术会议论文集[C];2010年
6 梁洁;杨新璐;;维吾尔语韵律层级边界感知及其声学特征研究[A];第九届中国语音学学术会议论文集[C];2010年
7 阿依克孜.卡德尔;开沙尔.卡德尔;吐尔根.依布拉音;;面向自然语言信息处理的维吾尔语名词形态分析研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
8 吾守尔.斯拉木;马欢;;维吾尔语文语转换系统的研究[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年
9 易斌;;维吾尔语元音/y/的声学特征分析[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年
10 艾斯卡尔·艾木都拉;赛尔达尔·雅力坤;祖丽皮亚·阿曼;地里木拉提·吐尔逊;;维吾尔语浊塞音的声学特征分析[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年
相关重要报纸文章 前10条
1 记者井波、实习生郁萌;维吾尔语水平考试系统进入研发阶段[N];新疆日报(汉);2010年
2 特约记者 蔺高峰 通讯员 武瑞;女法医“西日古丽”[N];喀什日报(汉);2010年
3 本报记者 任红芳;阿克苏电视台维吾尔语译制中心录音棚投用[N];阿克苏日报;2010年
4 一东;以多语种服务打造沟通新渠道[N];亚洲中心时报(汉);2011年
5 自治区地方志编委会、自治区党委驻伽师县工作队 张坚义;语言架起沟通心灵的桥梁[N];新疆日报(汉);2012年
6 刘冰;从王蒙流利的维吾尔语想到的[N];中国民族报;2013年
7 记者 江亚平;搞分裂慌不择言,热比娅谎话连篇[N];新华每日电讯;2009年
8 陈学迅;王蒙谈维吾尔民族语言文化[N];新疆日报(汉);2005年
9 记者 王新红;中央人民广播电台新疆维吾尔语编辑部工程开建[N];新疆日报(汉);2010年
10 记者 达·照日格图;我国首部蒙古文字手机研制成功[N];内蒙古日报(汉);2006年
相关博士学位论文 前10条
1 阿布都那扎尔·阿布都拉;维吾尔语构词词缀历时比较研究[D];中央民族大学;2009年
2 巴克力·阿卜杜热西提;古代维吾尔语医学文献的语文学研究[D];中央民族大学;2013年
3 倪宏鸣;维吾尔语和阿美语语言特征对比分析[D];中央民族大学;2007年
4 魏玉清;维吾尔语和谐现象的音系学研究[D];华东师范大学;2010年
5 尼加提·苏皮;维吾尔语伊犁土语研究[D];中央民族大学;2010年
6 斯迪克江·伊布拉音;现代维吾尔语中的比喻研究[D];华东师范大学;2008年
7 阿克里·先木西;维吾尔语表语—系动词谓语结构[D];中央民族大学;2012年
8 吐尔逊·卡得;维吾尔语柯坪土语研究[D];中央民族大学;2011年
9 木再帕尔(Muzappar Abdurusul);论维吾尔语的名词化短语[D];中央民族大学;2007年
10 席艳玲;维吾尔语失语症特点及其检查法的标准化研究和维吾尔族、汉族正常人脑激活区差异性的fMRI研究[D];新疆医科大学;2013年
相关硕士学位论文 前10条
1 魏文娟;改革开放以来维吾尔语新词研究[D];新疆大学;2008年
2 阿孜古丽·阿不都热西提;维吾尔语伊犁土语中的借词研究[D];西北民族大学;2008年
3 张红;探析维吾尔语中茶文化[D];新疆师范大学;2012年
4 热依拉·艾纰漏拉;汉语—维吾尔语颜色词翻译对比研究[D];中央民族大学;2013年
5 孔席梅;维吾尔语和回族话中借词的分析比较[D];新疆师范大学;2013年
6 吾斯曼·艾买尔(Osman Emer);《五体清文鉴》中的近代维吾尔语动物名称研究[D];伊犁师范学院;2015年
7 玛依热·吾司曼;汉维动力情态对比研究[D];中央民族大学;2015年
8 钱悦;汉语“V1着V2”结构与维吾尔语相关表达方式对比研究[D];中央民族大学;2015年
9 奇曼古丽·许库力;现代维吾尔语同义词研究[D];中央民族大学;2015年
10 田媛玮;汉语—维吾尔语五官词汇的对比研究[D];中央民族大学;2015年
,本文编号:1839660
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1839660.html