“中国少数民族语言语音声学参数统一平台建设研究”中期检查情况

发布时间:2017-01-05 12:35

  本文关键词:基于语音声学参数库的东部裕固语语音研究,由笔耕文化传播整理发布。


一、研究进展情况

一、 研究计划总执行情况

本项目总体上按照原计划实施。到目前为止共完成了蒙古语、维吾尔语、鄂温克语、土族语、东部裕固语、哈萨克语、锡伯语、鄂伦春语和东乡语等9种语言的索引库、声样库、音段标注库和声学参数标注库,已建立了蒙古、维吾尔、鄂温克、哈萨克、东部裕固和土族等6种语言的“语音声学参数数据库”(其中,蒙古、维吾尔、鄂温克等三种语言的参数库为熟参数库),正在研制锡伯语、鄂伦春语和东乡语的语音参数库。声学参数自动标注/提取:为提高工作效率,自2013年1月份开始我们课题组开始考虑声学参数自动标注和采集问题。在课题组成员的不懈努力下,目前我们已经实现了声学参数标注和采集的自动化目标。初步搭建了基于蒙古、维吾尔和鄂温克等三种语言的“语音声学参数统一平台”的框架。

二、 子课题进行情况

蒙古语族语言语音声学参数库(共4种语言)

(1)索引库:完成了蒙古、土族、东部裕固、东乡等4种语言的索引库。

(2)声样库:完成了蒙古、土族、东部裕固、东乡等4种语言的声样库。

(3)音段标注库:完成了蒙古、土族、东部裕固、东乡等4种语言的音段标注库。

(4)声学参数标注库:完成了蒙古、土族、东部裕固等3种语言的参数标注库。

(5)声学参数库:研制了蒙古、土族、东部裕固等3种语言的参数库。其中,土族、东部裕固等2种语言的参数库为“半熟库”。

突厥语族语言语音声学参数库(共2种语言)

(1)索引库:完成了维吾尔、哈萨克等2种语言的索引库。

(2)声样库:完成了维吾尔、哈萨克等2种语言的声样库。

(3)音段标注库:完成了维吾尔、哈萨克等2种语言的音段标注库。

(4)声学参数标注库:完成了维吾尔、哈萨克等2种语言的参数标注库。

(5)声学参数库:研制了维吾尔、哈萨克等2种语言的参数库。其中,哈萨克语的参数库为“半熟库”。

满通语族语言语音声学参数库(共3种语言)

(1)索引库:完成了鄂温克、锡伯和鄂伦春等3种语言的索引库。

(2)声样库:完成了鄂温克、锡伯和鄂伦春等3种语言的声样库。

(3)音段标注库:完成了鄂温克、锡伯和鄂伦春等3种语言的音段标注库。

(4)声学参数标注库:完成了鄂温克、锡伯和鄂伦春等3种语言的参数标注库。

(5)声学参数库:研制了鄂温克、锡伯和鄂伦春等3种语言的参数库。其中,锡伯语和鄂伦春语的参数库为“半熟库”。

统一平台建设

研制了以下几个工具

(1)生成三层标注文件格式工具

(2)生成八层标注文件格式工具

(3)自动修改文件名工具

(4)自动加五层标注层加词边界工具

(5)自动反转前三层并加五层工具

标准、特征集和管理程序

(6)确定统一的词表编写方法和标准

(7)确定统一的语音信号采集方法和标准

(8)确定统一的特征集

(9)确定统一的语音标注方法和标准

(10)编写声学参数自动标注软件(1.0版-3.3版)

(11)编写声学参数自动提取软件(1.0版-3.5版)

(12)研制统一的语音声学参数管理平台

三、 调查研究及学术交流情况

调查研究:自2013年7月开始,我们课题组前后赴内蒙古自治区正蓝旗、鄂温克族自治旗、鄂伦春族自治旗、新疆维吾尔自治区伊犁州、甘肃省肃南裕固族自治县、青海互助土族自治县等地进行语言调查和语音信号采集工作,采集了蒙古语、土族语、东乡语、东部裕固语、保安语、维吾尔语、哈萨克语、锡伯语、鄂温克语、鄂伦春语近三十个人,40多小时的十几个G的声样。发音人均来自上述地区的熟练使用本民族语言的教师、民间艺人和民族语言播音员。他们的发音纯正,能够代表本民族语言的语音特征,没有嗓音方面的疾病;录音地点:在当地广播电台标准录音棚或安静的住所;仪器设备:配有索尼指向性话筒 SONY ECM 44B和Creative录音软件的IBM R系列笔记本电脑。采样率为22kHz, 16bits,单声道,S/N 不低于45dB。

学术交流

[ 1 ] Huhe, A Preliminary Study on Relationship Among Altaic Languages Based on Acoustic Patterns, The International Scientific Conference “World of Central Asia”, Sep. 2012, Ulan-Ude, Russia.

[ 2 ] 呼和,哈斯呼,东部裕固语带擦元音初探,第十届中国语音学学术会议(PCC2012)会议,2012年5月,上海。

[ 3 ] 包桂兰,白音门德,呼和,蒙古语鼻音[n]的实验研究,第十届中国语音学学术会议(PCC2012)会议,2012年5月,上海。

[ 4 ] 胡红彦,,呼和,哈斯其木格,蒙古语标准音/s/辅音声学分析,第十届中国语音学学术会议(PCC2012)会议,2012年5月,上海。

[ 5 ] 韩国君,呼和,土族语短元音声学分析,第十届中国语音学学术会议(PCC2012)会议,2012年5月,上海。

[ 6 ] 乌日格喜乐图,呼和,论鄂温克语前高元音,第十届中国语音学学术会议(PCC2012)会议,2012年5月,上海。

[ 7 ] 呼和,语音声学模型对语言亲属关系研究中的作用和意义,“蒙古语族语言与地域文化研究”国际学术会议,内蒙古阿尔山,2012年8月18-21日。1万字。

[ 8 ] 呼和,蒙古语言文字信息处理目前所面临的几个问题,全国第四届蒙古语应用研究学术研讨会,呼和浩特,2013年11月。0.2万字。

[ 9 ] 呼和,语音声学模型与语言之间的亲属关系问题,International Conference on Phonetics of the Languages in China(ICPLC), 香港,2013年12月。1.5万字。

[ 10 ] 周学文,元音归一化的对数商模型,全国人机通讯学术会议NCMMSC 2013,论文,0.45万字,贵州贵阳,2013年8月。

[ 11 ] 周学文,Varying or Unvarying-Logarithmic Quotient Model of Vowel Formants, IALP 2013 国际会议,0.5万字,乌鲁木齐,2013年8月。

四、 本项目所培养的研究生情况

[ 1 ] 乌云那生,蒙古语阿拉善土语语音声学研究,中央民族大学博士学位论文,2013年5月。

[ 2 ] 韩国君,基于语音声学参数库的土族语元音研究,内蒙古大学硕士学位论文,2013年6月。

[ 3 ] 哈斯呼,基于语音声学参数库的东部裕固语语音研究,内蒙古大学博士学位论文,2014年6月。

五、 国际合作

自2012年7—9月期间,本项目承担着呼和研究员在俄罗斯科学院西伯利亚分院访问期间与俄罗斯布里亚特联邦共和国国立大学东方学系JARGAL 博士合作,开展了“布里亚特语语音声学参数数据库”的研制工作。目前该项目进展顺利,已完成了索引库、声样库的研制工作,正在进行语音标注。

六、 研究中存在的主要问题

因所涉及的语言较多,有些是濒危语言等原因加大了研究难度,可能不能按照原计划所预计的时间完成研究任务,退后结项时间。但我们团队会争取按时结项。

七、 需要说明的问题

? 因突厥语族语言子项目负责人西北民族大学信息学院的阿里木博士赴成都进修(1年)等原因,更换艾则孜为该子项目负责人。

? 因研究工作需要增加“东乡语和保安语”子项目并聘请西北民族大学蒙古语言文化研究院巴图格日勒教授为该子项目负责人。

二、研究成果情况

代表作(一)

“基于语音声学模型的阿尔泰语系语言亲属关系初探”(呼和,民族语文,2013年第3期)

基本内容和主要观点:本文提出用语音声学模型检验和判断语言发生学关系和类型学相似性的思路和方法,并以阿尔泰语系蒙古、维吾尔和鄂温克等三种语言的音段和超音段声学模型进行验证。音段声学模型,特别是三个极端元音声学模型的稳定性相对好。它不以语言或方言时间和空间的变化而发生较大改变,能够反映和代表语言或方言古老、深层的静态特点。与音段声学模型相比,超音段声学模型,特别是单词层面与词重音相关的音高、音长和音强等声学模型的稳定性相对差,它所反映的是语言或方言近代、表面的动态特点。从蒙古、鄂温克和维吾尔等三种语言三个极端元音声学模型的相似度(蒙古语与鄂温克语之间的相似度为0.91, 蒙古语与维吾尔语之间的相似度为0.74),可以得出蒙古语与鄂温克语之间的关系比蒙古语与维吾尔语之间的关系相对近的初步结论;但从三种语言在单词韵律层面上所呈现的相似性(“右短”、“右高”和“右强”)和差异性,却难以判断它们之间的亲近度;从蒙古、达斡尔和土族等三种语言三个极端元音声学模型的相似度(蒙古语与达斡尔语之间的相似度为0.93, 蒙古语与土族语之间的相似度为0.91),可以得出蒙古、达斡尔两种语言之间的关系比蒙古语与土族语之间的关系相对近的结论。

学术价值和社会影响:阿尔泰学研究经过近三个世纪的发展,达到了一定的水平。但是,尚未像印欧语系那样已经得到理论上的肯定,还有不少学者怀疑或反对阿尔泰学理论。主要意见有:(1)突厥语对蒙古语有过强烈的影响,而蒙古语又对通古斯语有过较大的影响。上述三个语族语言之间存在的相似性,可能是由于原有的结构相似加上相互接触和影响所造成的结果;(2)目前对“阿尔泰诸语言”在语源上是否存在亲缘关系的问题做肯定的回答还为时过早。有的则既不肯定阿尔泰诸语言间存在发生学上的关系,又不排除存在同源关系的可能性,提倡做更多的研究之后再下结论;(3)把阿尔泰诸语言间的共同成分看做是互借或相互影响的结果,从而认为突厥语、蒙古语和满洲一通古斯语等语言之间不存在发生学上的同源关系,只存在类型学上的相似性。他们的一个重要根据就是蒙古语和突厥语等语言之间不存在数词的共同性和一些基本词汇的同源性。

要打破阿尔泰学多年的僵持和发展缓慢等现状,需要理论和方法的创新,即必须摆脱原来的理论和方法框架,拓展思路,寻找新的方法和手段。通过多年的语音实验研究和描写研究实践,我们对语音声学、生理特征有了新的认识,积累了测量和采集声学、生理特征参数和利用这些参数描写特定语言音系系统的丰富经验。为了使语音实验研究更好地与历史比较语言学相结合,解决一些用传统方法无法解决的疑难问题,提升实验语音学在语言学研究中的地位和作用,本文提出用“语音声学模型相似度”来检验和判断语言之间亲属关系亲近度的思路和方法,并通过比较蒙古、维吾尔、鄂温克、达斡尔、土族和东部裕固等语言声学模型之间的相似度,探讨它们之间亲属关系的亲近度,即语言之间的同源关系和类型学上的相似性等问题。

“从语音声学模型之间的相似度检验和判断语言之间亲属关系的亲近度”(语言之间的同源关系和类型学上的相似性)是一个创新思路和方法,是一项新的课题。目的是把语言之间亲属关系研究基于语音科学实验之上,以便推动比较语言学研究。当然,我们的研究和分析,仅仅是学术上的一种尝试,我们的结论,也仅仅是基于现代蒙古语、维吾尔语和鄂温克语语音部分声学模型上的一家之见,有关阿尔泰语系假设的验证,仍需不同学科之间长期协同努力。

代表作(二)“彝语辅音谱特征分析”(周学文,中国语音学报第四辑,2013年)

基本内容和主要观点:本文采用“谱重心”(COG,Center of Gravity)、“离散度”(Dispersion)和倾斜度(SKEW表示低于谱重心的谱与平均频率以上的谱的差)等三个谱参数探讨了凉山彝语辅音特点。主要观点是:f的谱参数变化大,?最稳定,擦音s、?也比较稳定。Dispersion值从大到小排序为:s、?、?;f比?的Dispersion高;s比?的Dispersion和COG都大,特别是Dispersion差别明显。就清擦音的COG和Dispersion两个参数而言,Dispersion是更稳定、更容易区别单个清擦音的参数。

学术价值和社会影响:辅音声学分析,特别是清擦辅音声学描写研究一直是大家讨论和关心的问题。其中,采用哪个声学参数描写这些清擦音是问题的焦点。相对于元音的四个稳定而直观的特征(音长,音强,音色,音高),由于发音方法和发音部位的不同,辅音区别特征的定义就要复杂得多,而且缺乏直观的、稳定的、易于量化的区别特征。对于塞音/塞擦音而言,一般采用GAP(闭塞时间)、VOT(浊音开始时间,Voice Onset Time)、辅音长度等在语谱图上比较直观且容易提取的参数作为它们的区别特征,大量研究成果证实,GAP和VOT对塞音/塞擦音有明确的区别意义;对于浊音类的浊擦音、鼻音、边音等辅音,则可以提取其共振峰参数,但是他们的共振峰也不像元音共振峰那样稳定而明显,而且鼻音还经常受到反共振的干扰,在语谱图上难以分辨;对于由噪声源激励产生的清擦音,它们的频谱上经常表现为多个模糊的区域和乱纹,这些模糊的区域又称为能量集中区、强频集中区等,与元音共振峰类似,它们实际上也是声波在特定的频率域产生共振引起的,在语图上肉眼只能大概看出各个区域的边界,很难给出一个量化的指标描述这些区域,那么是否存在区分这些辅音的有效的、稳定的谱特征参数呢?本文在前人研究的基础上,提出了用“谱重心”、“离散度”和倾斜度等三个参数描写辅音声学特征的方法。这是语音声学分析中的一次创新,一次飞跃,将会有效推动辅音声学描写研究。

注:2010年立项的重大项目主要填写2012年6月以来的研究成果情况。

序号

成果名称

作者

成果

形式

刊物名或出版社、刊发或出版时间

字数

转载、引用、获奖等情况

 

1

蒙古语边音/l/的声学和生理研究

哈斯其木格

呼和

论文

民族语文

2012年第2期

0.8

 

 

2

蒙古语阿拉善话短元音声学分析

乌云那生

呼和

论文

西北民族大学学报

2012年第4期

1.3

 

 

3

基于PAS的蒙古语标准话辅音气流研究

呼和

周学文

论文

中央民族大学学报

2013年第2期

1.2

 

 

4

基于语音声学模型的阿尔泰语系语言亲属关系初探

呼和

论文

民族语文,2013年第3期

1

 

 

5

土族语词首音节元音声学分析

韩国君

呼和

论文

新疆语言与翻译

(蒙文版)2013年第3期

1.3

 

 

6

蒙古语标准音

辅音音姿

哈斯其木格

论文

中央民族大学学报(哲社版)2013年第5期

0.8

 

 

7

基于“语音声学参数数据库”的鄂温克语

辅音研究

乌日格

喜乐图

论文

实验语言学(日本)

2013年第3期

0.6

 

 

8

凉山彝语松-紧喉元音的声学特征

周学文

论文

民族语文,2013年第2期

0.5

 

 

9

彝语辅音谱特征分析

周学文

论文

中国语音学报

2013年第四辑

0.4

 

 

10

鄂温克语

清塞音实验研究

乌日格

喜乐图

论文

中国社科院民族所青年学术论坛论文集,社会科学文献出版社,2013。

0.5

 

 

11

蒙古语陈巴尔虎土语复合元音

哈斯其木格

论文

中国社科院民族所青年学术论坛论文集,社会科学文献出版社,2013。

0.5

 

课题组供稿


  本文关键词:基于语音声学参数库的东部裕固语语音研究,由笔耕文化传播整理发布。



本文编号:235077

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/rwkxbs/235077.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户5b8bc***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com