基于在线的维吾尔语语音语料库的建立及应用
本文选题:维吾尔语 切入点:语料库 出处:《新疆大学》2017年硕士论文 论文类型:学位论文
【摘要】:建立丰富的语音语料库是研究语音技术的基础,从工程方面看,语音语料库是更加完善语音技术的重要环节之一。针对现有的维吾尔语语音语料库的规模不大以及发音人员年龄和地区方面不平衡等问题,面对深入研究发展的需求,维吾尔语语料库急需扩大,尤其是对语音数据的多样化需要改进,使其更加实用化。因此,本文研究了维吾尔语语音语料库的建立方法及语料库在语音识别中的应用。主要研究内容如下:1)对传统的语音采集和语音语料的标注方法进行了改进。语音语料的采集需要大量的人力和时间。为了解决这一问题,配合维语语音数据采集工作,定制了维语录音工具,目的是简化录音流程,使其更加方便地进行远程数据采集与异地支持等工作。任何人都可以使用该平台进行语音采集数据。为了提高语音标注工作的效率,设计了相应的语音标注平台。这些新方法在实际应用中取得了很好的效果。2)根据维吾尔语的语言和语音特征,构建了多样化的大规模语音语料库。每一种方言中,根据地区的不同还包含了一些土语。有些同样的词在不同的方言中发音不一样。除此之外,不同年龄人的发音特征,韵律特征有一定的差异。因而,采集各地区的方言语音和各年龄段不同文化程度的自然人的语音数据,对语音识别中的特征参数提取和声学模型的优化有着一定的研究意义。目前影响提高识别率的关键因素就是语音的多变性问题。建立包含尽可能多语言现象的语料对语音的分析和识别工作至关重要。而提高语音语料库质量的另一个关键是选取覆盖尽可能多语言现象的文本。本文我们用常用词包含程度和三音子包含程度两种方法进行语料的筛选工作并与传统的随机筛选方法做了对比实验,其中本文提出的三音子筛选方法的覆盖率达到了91%。3)最后,利用语音识别技术中广泛应用的HMM和DNN两种方法对采集的语音语料的一部分进行声学特征提取和声学模型建模并进行了连续语音识别实验。实验中,在语言模型方面,采用了N-gram语言模型,在Linux环境下借助kaldi语音识别工具箱进行了对比识别实验。实验结果表明针对大规模的语音数据来说,DNN声学模型的语音识别结果更好。本文中基于DNN模型的识别率达到了84.49%。相比传统的模型,系统的识别率提高了1.77%。
[Abstract]:The establishment of rich speech corpus is the basis of the study of speech technology, from the engineering point of view, The phonetic corpus is one of the most important links to perfect the speech technology. In view of the problems of the existing Uygur speech corpus, such as the small size of the existing Uygur phonetic corpus and the imbalance in the age and region of the pronunciation personnel, the need for further research and development is faced with. The Uygur corpus urgently needs to be expanded, especially the diversity of speech data needs to be improved to make it more practical. In this paper, the establishment method of Uygur speech corpus and the application of corpus in speech recognition are studied. The main research contents are as follows: (1) the traditional methods of speech acquisition and tagging of speech corpus are improved. In order to solve this problem, In conjunction with the acquisition of Uygur voice data, a Uygur recording tool was customized to simplify the recording process. Make it more convenient for remote data acquisition and remote support. Anyone can use this platform for voice data collection. In order to improve the efficiency of voice tagging, The corresponding phonetic tagging platform is designed. These new methods have achieved good results in practical application. 2) according to the language and phonological features of Uygur language, a variety of large-scale speech corpus has been constructed. Some of the same words are pronounced differently in different dialects. In addition, there are some differences in pronunciation and rhythm between people of different ages. To collect phonological data of dialects in different regions and natural persons of all ages and different educational levels, It is of great significance to study the feature parameter extraction and the optimization of acoustic model in speech recognition. At present, the key factor affecting the improvement of recognition rate is the problem of speech variability. Language with as many linguistic phenomena as possible is established. Data is very important for speech analysis and recognition. Another key to improving the quality of speech corpus is to select text that covers as many linguistic phenomena as possible. In this paper, we use common words to include degree of inclusion and triphonetic inclusion. The two methods are compared with the traditional random screening methods. The coverage of the triphonon screening method proposed in this paper has reached 91.3. finally, Two methods, HMM and DNN, which are widely used in speech recognition technology, are used to extract the acoustic features and model the acoustic model of a part of the collected speech corpus, and the experiments of continuous speech recognition are carried out. Using N-gram language model, The contrast recognition experiment is carried out with the help of kaldi speech recognition toolbox in Linux environment. The experimental results show that the speech recognition result of the acoustic model is better for large scale speech data. The recognition rate based on DNN model in this paper is better. Reached 84.49. compared with the traditional model, The recognition rate of the system increased by 1.77.
【学位授予单位】:新疆大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TN912.34
【相似文献】
相关期刊论文 前10条
1 ;中央人民广播电台新疆维吾尔语编辑部开工建设[J];青年记者;2010年15期
2 ;中央电台新疆维吾尔语编辑部开工建设[J];中国广播;2010年06期
3 盛朝川;;维吾尔语专线广播[J];新闻记者;1984年03期
4 艾山·吾买尔;吐尔根·依步拉音;;基于最大熵的维吾尔语句子边界识别模型[J];计算机工程;2010年06期
5 王昆仑;张贯虹;吐尔洪江·阿布都克力木;;维吾尔语元音的声频特性分析和识别[J];中文信息学报;2010年02期
6 地里木拉提.吐尔逊;艾斯卡尔.艾木都拉;;维吾尔语中清化元音的实验语音学研究[J];中文信息学报;2010年05期
7 丁玉忠;吾守尔·斯拉木;那斯尔江·吐尔逊;;基于垃圾模型的维吾尔语关键词识别[J];现代计算机(专业版);2011年13期
8 塔世根·加帕尔,帕尔哈提·艾孜木,伊力亚斯·吐尔逊;维吾尔语地理学术语规范表达的必要性和紧迫性[J];术语标准化与信息技术;1998年04期
9 阿丽叶.阿布列孜;;中央人民广播电台维吾尔语频道《生活》栏目探析[J];新闻世界;2014年05期
10 哈妮克孜·伊拉洪;祖丽皮亚·阿曼;艾斯卡尔·艾木都拉;;维吾尔语单音节词复辅音声学分析[J];中文信息学报;2009年04期
相关会议论文 前10条
1 吾买尔江·库尔班;阿里甫·库尔班;;维吾尔语框架语义知识库语义角色描述体系研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
2 阿里甫·库尔班;吾买尔江·库尔班;尼加提·阿不都肉苏力;;维吾尔语框架语义网的数据库结构的设计[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
3 古丽娜尔·艾力;买买提玉素甫·苏来曼;;维吾尔语语音数据自动标注[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
4 阿布都热依木·热合曼;艾山·吾买尔;吐尔根·依布拉音;帕里旦·吐尔逊;哈里旦木·阿布都克里木;;维吾尔语句法树库标注体系[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
5 艾斯卡尔·艾木都拉;;维吾尔语鼻音的声学特征分析[A];第九届中国语音学学术会议论文集[C];2010年
6 梁洁;杨新璐;;维吾尔语韵律层级边界感知及其声学特征研究[A];第九届中国语音学学术会议论文集[C];2010年
7 阿依克孜.卡德尔;开沙尔.卡德尔;吐尔根.依布拉音;;面向自然语言信息处理的维吾尔语名词形态分析研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
8 吾守尔.斯拉木;马欢;;维吾尔语文语转换系统的研究[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年
9 易斌;;维吾尔语元音/y/的声学特征分析[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年
10 艾斯卡尔·艾木都拉;赛尔达尔·雅力坤;祖丽皮亚·阿曼;地里木拉提·吐尔逊;;维吾尔语浊塞音的声学特征分析[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年
相关重要报纸文章 前10条
1 记者井波、实习生郁萌;维吾尔语水平考试系统进入研发阶段[N];新疆日报(汉);2010年
2 特约记者 蔺高峰 通讯员 武瑞;女法医“西日古丽”[N];喀什日报(汉);2010年
3 本报记者 任红芳;阿克苏电视台维吾尔语译制中心录音棚投用[N];阿克苏日报;2010年
4 一东;以多语种服务打造沟通新渠道[N];亚洲中心时报(汉);2011年
5 自治区地方志编委会、自治区党委驻伽师县工作队 张坚义;语言架起沟通心灵的桥梁[N];新疆日报(汉);2012年
6 刘冰;从王蒙流利的维吾尔语想到的[N];中国民族报;2013年
7 记者 江亚平;搞分裂慌不择言,热比娅谎话连篇[N];新华每日电讯;2009年
8 陈学迅;王蒙谈维吾尔民族语言文化[N];新疆日报(汉);2005年
9 记者 王新红;中央人民广播电台新疆维吾尔语编辑部工程开建[N];新疆日报(汉);2010年
10 记者 达·照日格图;我国首部蒙古文字手机研制成功[N];内蒙古日报(汉);2006年
相关博士学位论文 前10条
1 阿布都那扎尔·阿布都拉;维吾尔语构词词缀历时比较研究[D];中央民族大学;2009年
2 巴克力·阿卜杜热西提;古代维吾尔语医学文献的语文学研究[D];中央民族大学;2013年
3 倪宏鸣;维吾尔语和阿美语语言特征对比分析[D];中央民族大学;2007年
4 魏玉清;维吾尔语和谐现象的音系学研究[D];华东师范大学;2010年
5 尼加提·苏皮;维吾尔语伊犁土语研究[D];中央民族大学;2010年
6 斯迪克江·伊布拉音;现代维吾尔语中的比喻研究[D];华东师范大学;2008年
7 阿克里·先木西;维吾尔语表语—系动词谓语结构[D];中央民族大学;2012年
8 吐尔逊·卡得;维吾尔语柯坪土语研究[D];中央民族大学;2011年
9 木再帕尔(Muzappar Abdurusul);论维吾尔语的名词化短语[D];中央民族大学;2007年
10 席艳玲;维吾尔语失语症特点及其检查法的标准化研究和维吾尔族、汉族正常人脑激活区差异性的fMRI研究[D];新疆医科大学;2013年
相关硕士学位论文 前10条
1 魏文娟;改革开放以来维吾尔语新词研究[D];新疆大学;2008年
2 阿孜古丽·阿不都热西提;维吾尔语伊犁土语中的借词研究[D];西北民族大学;2008年
3 张红;探析维吾尔语中茶文化[D];新疆师范大学;2012年
4 热依拉·艾纰漏拉;汉语—维吾尔语颜色词翻译对比研究[D];中央民族大学;2013年
5 孔席梅;维吾尔语和回族话中借词的分析比较[D];新疆师范大学;2013年
6 吾斯曼·艾买尔(Osman Emer);《五体清文鉴》中的近代维吾尔语动物名称研究[D];伊犁师范学院;2015年
7 玛依热·吾司曼;汉维动力情态对比研究[D];中央民族大学;2015年
8 钱悦;汉语“V1着V2”结构与维吾尔语相关表达方式对比研究[D];中央民族大学;2015年
9 奇曼古丽·许库力;现代维吾尔语同义词研究[D];中央民族大学;2015年
10 田媛玮;汉语—维吾尔语五官词汇的对比研究[D];中央民族大学;2015年
,本文编号:1618311
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/1618311.html